阅读906 返回首页    go 机器人


人工智能里程碑:新AlphaGo Zero横空出世,彻底摆脱人类

摘要:谷歌人工智能团队DeepMind宣布,新版AlphaGo——AlphaGo Zero可以只在了解比赛的规则,且没有人类指导的情况下自我学习。短短3天,AlphaGo Zero就完胜曾击败世界冠军李世石版本的AlphaGo。

打败目前人类围棋最高水平选手才过去不久,DeepMind团队又宣布了一个在AI历史上具有里程碑式意义的重磅消息:新版AlphaGo可以彻底摆脱人类的知识。

10月18日,谷歌人工智能团队DeepMind团队在期刊《Nature》上发表论文,宣布新版AlphaGo——AlphaGo Zero可以在没有人类指导的情况下学习。

我们在这里介绍一种仅基于强化学习(reinforcement learning)的算法,没有超越游戏规则的人类数据、指导或领域知识。

也就是说,AlphaGo Zero就像人类初学者一样,只是了解比赛的规则和比赛的最终目标来自我学习。而作为首个击败人类围棋冠军的程序,之前版本的AlphaGo是通过分析人类围棋高手的数千棋局来学习,并在自我对弈中不断强化。

AlphaGo Zero学到的围棋知识(图片来源:DeepMind 论文)

此次的亮点在于,AlphaGo Zero无需人类指导就能让自己成为自己的老师,并且训练的时间更短。

短短3天时间,AlphaGo Zero不但从头开始学习了围棋,并且击败了先前版本的AlphaGo。在与击败世界冠军李世石版本的AlphaGo对弈中,AlphaGo Zero以100:0的比分完胜。

AlphaGo Zero在击败AlphaGo Lee之前,进行了了490万次自我对弈;而AlphaGo Lee的训练时间则是数月。

团队甚至表示,仅仅40天后,AlphaGo Zero已经可以在与最先进版本的AlphaGo对弈中获得90%的胜率了。

AlphaGo Zero和先前版本AlphaGo的表现比较(图片来源:DeepMind 论文)

此次AlphaGo Zero的出现不仅仅意味着围棋上的成功,还意味着距离通过创建通用算法来解决科学中的难题又进了一步。

目前深度学习需要大量数据,而数据的获得成本高昂且难度十分大,有了这项技术后,人类今后将有可能解决更大的挑战,给人类生活带来根本性的变化。

DeepMind首席执行官Demis Hassabis承认,以运用这个技术解决实际生活中的许多问题。范围可以包括预测蛋白质分子的形状,这也是新药研发过重的重要一环;还可以设计新材料和进行气候建模。

最后更新:2017-10-19 09:00:03

  上一篇:go 人工智能如何彻底变革人力资源格局,如何部署?
  下一篇:go 就在这周!人工智能浪潮即将来袭,还不快来抢占先机!