430
機器人
人工智能再放“大招”:AlphaGoZero無師自通完爆AlphaGo
近日,DeepMind在Nature上公布了最新版AlphaGo論文,介紹了迄今為止最強的圍棋AI——AlphaGoZero。去年,AlphaGo代表人工智能在圍棋領域首次戰勝了人類的世界冠軍,但其棋藝的精進,是建立在計算機通過海量的曆史棋譜學習參悟人類棋藝的基礎之上的,而AlphaGoZero則不需要人類的專業知識,隻使用純粹的深度強化學習技術和蒙特卡羅樹搜索,經過3天自我對弈就實現了100:0擊敗阿法狗。 AlphaGoZero的成功證明了在沒有人類指導和經驗的前提下,深度強化學習方法在圍棋領域裏仍然能夠出色的完成指定的任務,甚至於比有人類經驗知識指導時,完成的更加出色。某種程度而言,AlphaGoZero展現出了機器“機智過人”的一麵,因為它不再被人類認知所局限,而能夠發現新知識,發展新策略,它也再度證明了深度強化學習的強大能力,這一成果也勢必將推動該領域的進一步發展。

出品:科普中國
製作:中國科學院自動化研究所
監製:中國科學院計算機網絡信息中心
“科普中國”是中國科協攜同社會各方利用信息化手段開展科學傳播的科學權威品牌。
本文由科普中國融合創作出品,轉載請注明出處。
最後更新:2017-10-26 12:40:12