2014-01-16

機器學習演算法能使化學反應更聰明

Programming smart molecules: Machine-learning algorithms could make chemical reactions intelligent
http://phys.org/news/2013-12-smart-molecules-machine-learning-algorithms-chemical.html

Dec 12, 2013

哈佛 SEAS 與哈佛 Wyss 生物啟發工程研究所(Wyss Institute for Biologically Inspired Engineering)的電腦科學家聯合將強大的機率推理(probabilistic reasoning,概率推理)演算法交給了生物工程師。

一篇在 2013/12/7 於 Neural Information Processing Systems 研討會上進行簡報的論文裡,Ryan P. Adams 與 Nils Napp 證明,一種很重要的人工智慧演算法,能以「化學反應」來實作。

這些演算法 -- 那利用一種技術,稱為「分解圖(factor graphs,因子圖)上的訊息傳遞影響」 -- 是來自圖論(graph theory)與機率的點子,在數學上的一種耦合。它們代表機器學習(machine learning)中的尖端科技,而且已然是搜尋引擎、詐欺偵測,到行動電話中的錯誤校正等日常工具中的關鍵元件。

Adams 與 Napp 的研究證明,人工智慧(AI)的某些觀點能在微小的尺度下利用分子來實作。研究者表示,長遠來說,這樣的理論性發展能開啟「聰明藥物(smart drugs)」的大門,那利用各式各樣可進行 AI 型推理的化學物質,自動進行偵測、診斷與治療各種疾病。

"我們了解很多關於 AI 系統的建造,這些系統在巨觀尺度下能學習與適應;這些演算法活躍在許多我們每日與之互動的裝置的背後," Adams 說,SEAS 的電腦科學助理教授,其「智慧機率系統(Intelligent Probabilistic Systems)」小組聚焦在機器學習與計算統計學上。"這項研究證明,在微小的尺度下也有可能打造出一部智慧機器,而且不需要任何看起來是一般電腦的東西。這種「基於化學的 AI」對於建構能感應與適應其環境的治療方法來說將是必要的。希望最終能開發出根據個人的「化學性質」自行「特化」的藥物,而且能診斷或治療一系列病原體。"

Adams 與 Napp 設計出一套工具,能對世界中的未知數進行機率性的重現(probabilistic representations of unknowns,若以機器學習的行話來說叫做「機率圖模型/probabilistic graphical models」)並將之編譯成一組化學反應,那能估計無法直接進行觀測的數量。關鍵的洞見在於化學反應的動力學(dynamics)能直接對映到二種類型的計算步驟,而電腦科學家通常會在電腦模擬中進行(in silico),以達到相同結果。

這種洞見為研究「統計機器學習」的電腦科學家,開啟有趣的新問題,諸如,如何開發新的演算法與模型,那專門被設計用來對付工程師得經常面對的不確定分子(uncertainty molecular)。除了聰明療法(smart therapeutics)的長期可能性外,它或許也開啟了另一扇門,能把自然的生物反應路徑與調控網路當成可進行統計推論(statistical inference)的機制來分析。

正如同機器人,生物細胞必須估計外部環境狀態並據此採取行動;設計出能進行這些任務的人造系統將使科學家對於「在活體系統內的分子層次上,這些問題能被解決多少」能有更好的理解。

"這裡有許多開發化學計算裝置的研究正在進行中," Napp 說,Wyss 研究所的博士後研究員,正在研究生物啟發機器人平台,同時也是 SEAS 自組織系統(Self-organizing Systems)研究小組的成員。這二個小組都由 Radhika Nagpal 所領導,SEAS 的 Fred Kavli 電腦科學教授以及 Wyss 的核心專任成員。在 Wyss 研究所,Napp 的部份研究涉及開發新型機器人裝置,那如同活生生的生物般移動與適應。

"使這項計畫與眾不同的是,我們並非以一般性計算為目標,而是聚焦在有效率地轉譯(translating)特殊演算法上。從機器人學到分子描述(molecular descriptions)等領域中,這些演算法已成功解決困難的問題," Napp 解釋。"例如,這些演算法允許今日的機器人做出複雜的決策以及可靠地使用噪音感應器。一想到這些工具也許能夠用來建立更好的分子機器,真的令人感到振奮。"

確實,這個機器學習領域正在革新許多科學與工程領域。能從大量微弱與不完整的資訊中萃取出有用的洞見不僅僅為當前受到關注的「big data」火上加油,也能加速較傳統學門,例如電腦視覺、估計與機器人學的發展,這些領域中可以取得資料,但難以詮釋。生物工程師通常會面臨類似挑戰,有許多分子路徑依然沒有特徵化,而可取得的資料則因隨機雜訊而變得殘缺不堪。

利用機器學習,這些挑戰現在能藉由「隨機變數之間的相關性(dependencies between random variables)」的塑模而獲得解決,而且能用它們從每次所提供的隨機事件中萃取並累積少量的資訊。

"機率圖模型(Probabilistic graphical models)對於未觀測現象的計算評估來說是格外有效率的工具," Adams 說。"能發現這些工具與細胞生物學的世界有這麼棒的對映,真令人感到非常振奮。"

※ 相關報導:

尋找網路的演算法-- 用於基因或網際網路
研究者排除藥物發現的瓶頸
數位通訊技術協助釐清個人化治療途徑
計算成就加速尋找基因:在幾毫秒內而非幾年內
簡化的「複雜性」 -- 基因組如何作用的新洞見

發現科學新知的電腦與機器人
學習分享的機器人,驗證漢彌爾頓規則(含影片)
研究者賦予機器人學習的能力(含影片)
成群的機器人飛向藍天(含影片)
從聊天機器人到「分析黑洞」

科學家以DNA 創造出第一個人造神經網路
科學家從細菌與DNA 創造出運算基石
研究者創造首個完整的生物體電腦模型

科學家朝「無機生命」的創造邁進
「Google 加強版」:科學家創造化學腦
突觸電晶體邊運算邊學習

沒有留言: