238
DotA
輸了輸了!DOTA世界冠軍被OpenAI完虐
來源 /TwoMinute Papers
翻譯 /洪振亞
校對 /朱婷
整理 /雷鋒字幕組
AI 研習社出品係列短視頻《 2 分鍾論文 》,帶大家用碎片時間閱覽前沿技術,了解 AI 領域的最新研究成果。
本期看點
OpenAI s Bot Beats DOTA World Champion Dendi
OpenAI 成功擊敗 DOTA世界冠軍 Dendi
相信玩過DOTA的朋友,都知道Dendi這號人物,Dendi是DOTA2的現役職業選手,刀友們評價他“意識好,大局觀強,操作犀利,手速極快”。最重要的是,頂尖級選手Dendi常常不按常理出牌,對手很難摸清他的路數。
不過,Denbi再怎麼厲害,還是敵不過OpenAI的Bot。人機大戰中,OpenAI的Bot不僅取得了勝利,還讓Dendi的徹底崩潰了。Dendi在比了兩場之後就悻悻退出。
對於DOTA2人工智能訓練的結果表明,如果計算夠充分,自我對練可以將機器學習係統的性能從遠低於人類的水平推向超越人類。

觀看論文解讀大概需要7分鍾
從不敵高排名選手到擊敗頂級職業選手,一個月的時間裏,人工智能係統持續提升。有監督的深度學習係統,最多達到訓練數據集的程度,但在自我對練係統中,隨著代理程序越來越好,可用的數據水平也自動提升。
TrueSkill評級(類似於國際象棋中的ELO評級)通過模擬機器人之間的比賽和觀察勝率計算,對最好的DOTA機器人進行了長時間的記錄。從添加新特征並改進到算法到特征縮放,係統的每個部分都有改進。
最驚人的是,能力提升直線上升,隨著時間的推移可以指數級地改善這個係統。
隨後,OpenAI團隊還在博客中更新了更多技術細節,公開了AI打敗另外幾個人類高手的精彩視頻。
博客原址
https://blog.openai.com/more-on-dota-2/
新人福利
關注 AI 研習社(okweiwu),回複1領取
【超過 1000G 神經網絡 / AI / 大數據,教程,論文】
DeepMind發布《星際爭霸 II》深度學習環境 | 2分鍾讀論文
最後更新:2017-10-17 21:38:27