554
機器人
人工智能超越人類不是夢?從 AlphaGo Zero 開始!
僅用40天,新版本的AlphaGo Zero 便以100:0的勝率擊敗了戰勝柯潔的AlphaGo Master……
從一無所知到自學成才,AlphaGo Zero驚人的成長速度使得圍棋高手柯潔也忍不住咋舌。
為何新版的AlphaGo Zero 進步如此迅速?究竟它與曆代AlphaGo有何不同?
此次最近版本AlphaGo Zero是通過一種名為“強化學習”的機器學習技術,可以在與自己遊戲中吸取教訓。
曆代AlphaGo所接受的訓練是觀摩由實力強大的業餘或專業棋手對弈的海量棋局。但AlphaGo Zero並未受到這樣的幫助, 並直接跳過了這一個步驟。它自我對弈數百萬次,並從中學習。AlphaGo的首席研究員大衛·席爾瓦(David Silver)表示,“由於未引入人類棋手的數據,AlphaGo Zero遠比過去的版本強大,我們去除了人類知識的限製,它能夠自己創造知識。”
通過全新的強化學習(reinforcement learning)方式,AlphaGo Zero 真正做到“無師自通”。整套 AI 係統始於一個對圍棋一無所知的神經網絡,通過一套強大的搜索引擎來與自己對弈。這個原本一片空白的神經網絡與自己對弈的局數越多,就越能準確的調整與預測下一步棋的走法,對圍棋的掌握程度也越來越高。
這套升級過的神經網絡通過與搜索算法的再次整合,最終形成了全新的、更強大的 AlphaGo Zero,並不停重複這一過程。在每一個迭代版本中,係統的性能都有小的提升,自我對弈的質量也越來越高,因此形成了一個越來越精準的神經網絡,這就是空前強大的 AlphaGo Zero。

僅經過三天的訓練,該係統能夠擊敗AlphaGo Lee,後者是去年擊敗了韓國選手李世石(Lee Sedol)的DeepMind軟件,勝率是100比0。。經過大約40天的訓練(約2900萬場自玩遊戲),AlphaGo Zero擊敗了AlphaGo Master(今年早些時候擊敗了世界冠軍柯潔)。
使我們驚豔的不僅僅是AlphaGo Zero背後的強大算法,更難可貴的是它的創造力。而這一“天賦”也將幫助人們解決許多現實問題。
DeepMind的CEO丹米斯·哈撒比斯(Demis Hassabis)表示,“對我們來說,AlphaGo不僅限於在圍棋對弈中獲勝,這也是我們開發通用算法的一大進步。”大多數AI被認為“用途有限”,因為它們隻能執行單一任務,例如,翻譯、識別麵孔。但通用型AI在許多不同任務上擁有超越人類的潛能。哈撒比斯認為,在接下來十年,AlphaGo的迭代產品將成為科學家和醫學專家,與人類並肩工作,例如蛋白質折疊、減少能源消耗或尋找革命性的新材料,這些突破在對社會產生積極影響上潛力巨大。
AlphaGo Zero的問世意味著人類在人工智能領域的發展有了新的突破,或許,人工智能時代的到來已不遠矣。
既然時間如此緊迫,還不知道什麼是人工智能的你還不趕快學習?伴隨著人工智能時代的到來,人工智能相關人才將成為國家不可獲缺的中堅力量!
為配合國務院印發的《新一代人工智能發展規劃》,為提升全國中小學生在人工智能時代的競爭力,科飛豆研學現已推出“走進中科院,走近科學家--北京五天四晚“創客”主題研學營”,此次研學活動將以人工智能相關課程為切入點,將編程教育與參觀考察、科普講座、研究探索、實踐製作、交流探討等活動有機結合起來,激發學生們對於“創客”的興趣,拓展學生們的科學視野。此次研學活動還將邀請“創客”教育專家,通過麵對麵交流等形式帶領學生們認識“創客”、了解“創客”、學習“創客”。
了解詳情或報名請進群或撥打我們的電話進行谘詢。
現已推出的“走進中科院,走近科學家”係列主題寒假研學產品有:“5天4晚創客主題研學營”|“5天4晚“物理學科規劃”研學營”|“5天4晚“化學學科規劃”研學營”|“5天4晚“生物學科規劃”研學營”|“5天4晚天文主題研學營”,現已開展市場合作,詳情請進群谘詢群主。
寒假研學市場合作4群
聯係我們
地址:北京市海澱區中關村南三街8號院中科院物理所7號樓209室
如有投稿、轉載、合作事宜請聯係
最後更新:2017-10-20 17:50:02