登陆 | 订阅服务 | 广告服务 | 电子报 繁体 | 简体

 
 

   
 



香港商報

AlphaZero登《科學》封面
2018-12-08    香港商报
 

AlphaZero登《科學》封面

自學「成才」:一個算法完敗三大棋

【香港商報訊】12月7日,谷歌旗下AI公司DeepMind的通用棋類算法,也是迄今最強棋類AI--AlphaZero,被頂級期刊《科學》以封面論文形式正式引入學界和公眾視野。同時,這也是經過完整同行審議的AlphaZero論文,首次公開發表。

博弈結果經同行評估驗證

論文描述了AlphaZero如何快速學習每個遊戲,如何從隨機對弈開始訓練,在沒有先驗知識、只知道基本規則的情況下,成為史上最強大的棋類AI。《科學》雜誌評價稱,能夠解決多個複雜問題的單一算法,是創建通用機器學習系統,解決實際問題的重要一步。

DeepMind說,AlphaZero現在已經學會了三種不同的複雜棋類遊戲,並且可能學會任何一種完美信息博弈的遊戲,這「讓我們對創建通用學習系統的使命充滿信心」。

AlphaZero到底有多厲害?總結如下:在國際象棋中,AlphaZero訓練4小時就超越了世界冠軍程式Stockfish;在日本將棋中,AphaZero訓練2小時就超越了世界冠軍程式Elmo;在圍棋中,AlphaZero訓練30小時就超越了與李世石對戰的AlphaGo。

一年前,DeepMind悄然在arXiv貼出AlphaZero的預印版論文時,就已在圈內引發轟動。現在,DeepMind將同行完整評估後的AlphaZero公之於眾,不僅驗證了上述結果,還補充了新的提升。

國際象棋世界冠軍:機器也能成為專家

國際象棋大師卡斯帕羅夫--20年前輸給IBM深藍的國際象棋世界冠軍,昨天在《科學》上發表社論,表示他很高興看到AlphaZero展現出了像他一樣「動態、開放」的棋風:傳統觀點以為,機器將通過無休止的枯燥操作趨近完美,最終導致平局。但據我觀察,AlphaZero優先考慮棋子的活動而非盤面上的點數優勢,更喜歡在我看來有風險和激進的地方落子。

AlphaZero證明了機器也能成為專家,機器生成的知識也值得人類去學習。「AlphaZero以這樣一種強大而有用的方式超越了我們」,卡斯帕羅夫寫道,「只要在虛擬知識能夠生成的領域,這個模型都可能複製到任何其他任務上」。

AlphaFold獲醫療大突破

除了AlphaZero外,DeepMind近期在醫療領域也取得重大突破。該公司宣布已經打造了一個名為AlphaFold的AI系統,能夠應對當今生物學中最大的挑戰之一:模擬蛋白質的形狀。

蛋白質是維持生命所必需的結構複雜的大分子,動物身體的幾乎所有功能,包括肌肉收縮、感知光線或將食物轉化為能量,都與一種或多種蛋白質的移動和變化情況有關。但預測蛋白質結構是目前生物學的最大挑戰之一,一旦取得突破,對阿爾茨海默氏症、帕金森氏症等病症的診斷和治療都將具有很大意義。

在本月2日舉行的有蛋白質結構預測「奧運會」之稱的CASP全球競賽上,AlphaFold以優異成績碾壓了人類專家。

 
(來源: 香港商报) 編輯: 肖靜文