<產業訊息>Google機器學習助攻 行星發現與基因定序有功
#機器學習 #變體識別 #深度學習 #提高基因組測序準確性
Google機器學習好厲害,竟能協助天文學家發現新行星、還能對醫療方法與藥物開發領域帶來全新幫助。Google今日在台舉辦媒體聚會,分享其運用機器學習(Machine learning)技術在科學探索領域的階段性成果。
機器學習模型成功發現2顆新行星
首先,在天文學領域,Google Brain團隊(Google在人工智慧領域的研究團隊)與NASA(美國太空總署)以及德州大學進行合作,成功發現了2顆過去的研究方法所沒有發現的行星。
Google Brain研究團隊資深軟體工程師Chris Shallue指出,自2009年5月開始的克卜勒任務(Kepler mission),天文學家利用人工方式檢查超過3萬個由克卜勒太空望遠鏡(Kepler space telescope)所偵測到的訊號,在當中有超過2335個訊號被認為是行星。
然而由克卜勒太空望遠鏡所偵測到的訊號中,有大量參有雜訊、且訊號較弱的訊號無法利用人工來判斷(太過耗時費工)。於此之際,就是運用機器學習技術的良好契機。Google運用了與Google相簿所利用的卷積神經網路(convolutional neural network,一種特定的神經網路,通常用於圖像分類),來預測所偵測到的訊息是否為行星。
Google Brain研究團隊資深軟體工程師Chris Shallue指出,過去天文學家需要可能需要花費長達幾個小時才能判斷某個訊號是否為行星,但透過經過訓練的機器訓練模型,則能夠在不到一秒的情況下做出判斷(最終結果仍需要天文學家進行驗證,因為軟體開發工程師並不具備天文學的知識)。而藉由此訓練模型,Google在克卜勒資料庫中的670個恆星星系中,成功發現了克卜勒-90i與克卜勒-80g兩顆行星。
大幅提升準確率的變體識別工具─DeepVariant
變體識別(Variant Calling)是一種找出「個體」與「參考基因組」之間差異的方法。變體識別是藥物開發與醫療檢測技術的第一步,因此運用範圍相當廣泛。Google利用深度學習的方法,開發出一款可提高基因組測序準確性的開源工具,錯誤率僅是其他Variant Caller的1/2或1/3錯誤率。
Google Brain研究團隊資深軟體工程師張碧娟指出,由於基因組測序的資料量龐大,以及儀器讀取的結果片段且不完整,讓變體識別的作業遭遇相當大的困難。因此,Google利用了深度學習的方法來學習哪些參數最有用。Google Brian團隊與Verily Life Science團隊利用兩年多的時間,開發了一款可提高基因組測序準確性的開源工具─DeepVariant,利用了將測序儀的數據轉為圖像格式的方法,來訓練變體識別模型。DeepVarient在2016年、2017年分別贏得美國食品藥物管理局所舉辦的變體識別比賽。
針對今日Google Brain團隊在天文學以及生物科技領域的發展,Google台灣區董事總經理簡立峰指出,這些成果展現了跨領域人才合作的潛力。他表示,以上的研究成果都是基於開發源碼與開放資料才得以成就,透過開放資料,能讓不同領域的研究相互參照,得以加速各領域的發展。以台灣來說,在基因測序也投入不少,此外還擁有農業相關研究技術的基礎,未來如果妥善利用這些已開放的工具,能夠在農業病蟲害防治、農業改良以及人體疾病預防等,能帶來許多幫助,也是台灣未來在AI領域的發展機會。
全文網址:
http://www.chinatimes.com/realtimenews/20180206002624-260412
Search