217
机器人
人工智能那么厉害 可能会成为迄今为止最好的人类帮手
据新华社2016年7月20日报道,AlphaGo在世界职业围棋排名上超过围棋选手柯洁,当前AlphaGo世界排名第一。在今年三月的人机大战中,AlphaGo战胜韩国选手李世乭,杀入职业围棋世界排名,名声大噪。
1956年新罕布尔州达特茅斯学院召开的提出人工智能概念的研讨会,会议四位组织者之一马文·明斯基(Marvin Lee Minsky)教授,在今年1月24日辞世,作为人工智能最早的奠基人,如果他看到今天人工智能已经在运算量最大的棋类游戏中战胜人类,该是怎样的感慨。
看过今年人机大战实况的朋友都还记忆犹新,AlphaGo和李世乭的五盘棋下的十分精彩,棋局之上表现的是两个世界顶级棋手的对弈。李世乭的韩国棋风展现的非常到位,从开始几局棋争夺几子,到后来冒着满盘皆输的风险,频繁打劫。AlphaGo被认为是一个非常可怕的棋手,单纯从棋局现象上主要体现在它的深不可测和“围棋智慧”。AlphaGo的深不可测在于,包括所有赢李世乭4局棋在内,AlphaGo在训练过程中,之前的围棋选手对弈,都是以几个子取胜,最早与业余水平的研究人员下棋是赢几个子;与专业二段选手下棋还是赢几个子;与退役的专业九段选手下棋仍然赢几个子;同样与李世乭下棋也是仅赢几个子。AlphaGo似乎从来没有漏出它的最强实力,总是比对手强一点点。AlphaGo不应该表现出所谓的“围棋智慧”,因为它是机器,但它下出了如棋圣吴清源的“神之一手”也是不争的事实。王檄九段对AlphaGo的评价是:AlphaGo更像是巅峰的李昌镐和李世乭的加强版。韩国韩钟振九段负责比赛现场解说,他调侃道:“作为曾经被李世乭蹂躏的棋手,我现在的心情是,李世乭什么时候变得这么容易对付了。”
AlphaGo如同所有人工智能程序一样,并不知道自己到底在做什么,它们只是在按照指令进行计算。AlphaGo通过矩阵运算完成每一个棋局,即便它是当前最先进的人工智能,但它也无法像人一样表达感受,不然Google会安排一个赛后采访环节,相信这也是谁都不会错过的。
事实上,AlphaGo的开发公司——Google DeepMind(前文中有介绍)这家早期的成立于英国的人工智能企业,后被Google收购。Google DeepMind专注于人工智能的研究,他们公司内部有很多项目并行,这次AlphaGo与李世乭的围棋大战,与其说是其最新人工智能成果展示,不如说是一次空前的公关宣传。因为在其内部,选择围棋作为挑战目标,就是因为围棋是所有可以与人类对决的游戏中最困难的一个。之前IBM的超级计算机深蓝战胜国际象棋世界冠军卡斯帕罗夫,已经证明了计算机在这方面的潜力,围棋和国际象棋相比,在运算量上有了指数倍增长。为表现当前人工智能的先进程度,这是Google DeepMind选择围棋的原因。在AlphaGo开发的早期,Google DeepMind内部研制了数十个版本,这几十个版本互相对弈,通过积分卡的形式筛选出较先进的版本对老版本进行替代,当然工程师会不断对已有版本进行加强,在这个过程中,每个AlphaGo版本之间进行了数量非常庞大的棋局对弈,在完成版本之间互相筛选之后,才会进入机器与真人棋手的实验性对弈。不管是AlphaGo版本之间还是AlphaGo和真人棋手之间,每下一盘棋,机器都学习围棋技术,完成进化。
在职业围棋界,相邻段位之间,高段位选手对低段位选手之间的胜率是70%对30%,如果一个职业九段选手对阵一个职业八段选手,那么职业九段选手获胜的概率是70%,职业八段选手获胜的几率是30%。AlphaGo最早的职业棋手陪练是二段樊麾,在人类之间九段选手对人类二段选手,胜率是95%到98%,最高为98%,仍有5%到2%几率是二段选手获胜,但是AlphaGo在与人类二段选手的对弈中可确保100%获胜,所以在开赛之前,Google DeepMind对于战胜李世乭是有信心的,但因为只有五局,也有可能根据李世乭个人发挥出现小概率事件,所以官方在一开始并没有太过高调宣传。
AlphaGo的核心是两套计算机神经网络系统。“策略网络”(policy network)和 “价值网络”(value network)。它们通过算法计算优势棋步,避免出现任何“昏招”,原则上和李世乭在棋局上的考量是相同的。“策略网络”负责减少搜索宽度,当计算机面对棋局时,有些棋步明显是“昏招”,比如不该给对方送子,这样的棋步会首先摒弃掉,计算机将不会对其进行任何分析计算;“价值网络”负责减少搜索深度,计算机会一边推算一边判断局面,当局面明显处于劣势的时候,计算机会直接抛弃某些路线,避免死板的出现一条道走到黑的情况。AlphaGo就是利用策略网络和价值网络来分析整个局面,判断每步下子策略的优劣,就像人类棋手会对棋局进行判断和推测一样。可是AlphaGo在分析能力上相比于人类是有优势的,比如计算机判断未来20步的情况,就能相对准确的判断哪里下子赢的概率会高,而很少出错误,人类选手会受很多诸如精力、体力以及很多外部因素的影响,小概率的做出不明智的判断,往往这个时候,就是一局棋胜负的关键。
AlphaGo能在围棋上战胜人类,那我们可以断言,很多与概率有直接关系的游戏和活动,人工智能都能完胜人类。国际象棋、桥牌、国际象棋(十几年前人类已经被机器打败),乃至于中国人津津乐道的麻将,这些游戏人类通通不再是机器的对手。有人感慨,本来充满艺术和美感的围棋,被人工智能变成了冷冰冰的计算问题,这太令人沮丧了。这确实没错,很多事情在蒙着面纱时,人们总是对其充满了美好的想象,但是人类技术进步正是伴随着一个又一个神秘面纱的揭开而前进。IBM深蓝打败国际象棋大师卡斯帕罗夫的时候,很多人担忧之后会削弱人们对国际象棋的热情,可事实恰恰相反,世界范围内参与国际象棋职业锦标赛的选手水平,在人工智能国际象棋软件的训练下达到了前所未有的高水平,喜爱国际象棋的人也比之前有了大幅提高,荣获国际象棋大师头衔的选手是过去的一倍以上。这就是人类的小伙伴,它让我们变的更强。
有了这样一个计算能力超强的小伙伴,我们似乎迎来了一个赚钱的好机会,那就是去赌场,事实上确实是这样,在赌场中一个记忆力稍好的人就可以通过记牌赚到钱,因为像拉斯维加斯和澳门赌场是不洗牌的。如果稍微加一点计算,那就几乎可以保证稳赚不赔。那如果带上AlphaGo这样的小伙伴呢,那赌场就要赔死了。事实上,赌场的经营者完全明白计算设备对他们生意的威胁,所以在这里有好的提醒各位读者,如果有机会去到赌场,请把你的随身智能设备收起来,不然赌场保安会友好的将你请出去的。当然,你也不要明目张胆的拿出小本做笔算,这也会招来同样的待遇,即便是你掰着手指做口算,只要有记牌和算牌的迹象,赌场工作人员都会过来终止你的游戏。财大气粗的赌场肯能不会在乎你赌赢的那一点小钱,但你的计算行为拉低了整个牌桌玩家下注的速度,进而影响了赌场赚钱的速度,这种行为是绝对不会被容忍的。由凯文·史派西(Kevin Spacey)主演的电影《决胜21点》讲述了麻省理工学院米基·罗萨教授带着几个数学天才少年,乔装打扮混入拉斯维加斯,通过记牌算牌赚钱,并惹恼赌场的故事。他们为什么要乔装打扮,因为米基·罗萨教授早就因为他在赌场运用数学赚钱的行为,被所有赌场划定为不受欢迎的人。真实世界中,也确有这样的故事,斯坦福大学教授,《信息论基础》的作者,托马斯·科弗(Thomas Cover)就因为他算牌,被拉斯维加斯列为不受欢迎的人。
人工智能的系统成熟之后,下一步发展的方向就是应用,本质上讲,除非需要人工智能作为人类棋手的陪练,否则人工智能拥有再高的棋艺对我们的实际应用意义还是很小。在将来,我们希望人工智能可以为我们解决更多的实际问题。事实上,在十九世纪五十年代,人工智能概念刚刚出现的时候,当时的计算机就为美军的作战信息化做了大量工作,原理跟今天人工智能的深度学习极其类似,将大量数据输入计算机,让计算机筛选出最优的作战方案。如今在全球金融市场上,80%以上的股票交易都是由计算机完成,计算机负责寻找价值洼地、筛选交易策略,并高速完成交易,我们人工操作的证券交易与之相比完全不在一个层级,计算机在信息、策略、交易等各个方面比人工操作都有明显的优势。当然,计算机交易系统的成本也非常高,超出了一般个人可以承受的范围,所以当前还仅是机构在使用。事实上,人工智能大面积接管金融交易也有风险,2016年10月7日的英镑下跌,据以为是多家金融机构人工智能系统的抛售指令产生的连锁效应所致。英国央行已经对此事展开调查,至本初出版仍没有详细调查结果公布,但这从一个侧面也反映了人工智能在迅速取代人力时的不确定性,人工智能在寻找价值洼地上的出色能力是毋庸置疑的,可如果本次英镑下跌真如大家预测的那样,人工智能与人类交易员在“市场感觉”方面,还有相当的差距。
近些年来,滴滴出行和Uber的出现,给人工智能接入我们的生活服务提供了可能,我们的智能手机可以采集城市中每个人出行的时间、路线、方位等信息,将这些信息交给人工智能处理,它会为我们制定最优的出行计划,如果类似原理的套系统被城市管理者使用,人工智能就可以有效调控城市交通,增加城市道路的使用效率。这种结合了大数据和人工智能的生活服务类应用,将有望在这几年实现。人工智能在医疗领域的进展也非常迅速,除了我们在前文中介绍的IBM的沃森,还有很多医疗领域中专门功能的人工智能在发展。人工智能通过病例和化验报告诊断的能力可以与中等水平医生比肩,我们之前讲过。在识别医学影像判断人体病变、制定外科手术细节方案(穿刺取样深度、微创手术角度等)方面,人工智能已经达到当前最优秀的人类医生的水平。
如果将人工智能、机器人技术、医学成像技术乃至虚拟现实技术融合,那将是极有想象空间的。达芬奇(da Vinci)手术机器人是当前较成熟的外科医学机器人成果,它准确的名字应该叫“内窥镜手术器械控制系统”,达芬奇手术机器人由三个主要部分组成:1、医生控制系统;2、三维成像视频影像平台;3、机械臂,摄像臂和手术器械组成移动平台。我们知道,机械的动作比人类更加精确,运用这套系统,主刀医师不与病人直接接触,通过三维视觉系统和动作定标系统对机械臂进行操作控制,由机械臂以及手术器械完成手术操作。最新的达芬奇手术机器人已经按照既定程序,在医生的监控下实施常规手术。在未来,随着手术程序的不断完善,会有更多的手术可以通过这套系统精确完成。我们还可以想象,一旦无误差的影像传输和控制信号传输技术成熟,医生可以在千里之外为患者实时手术,到那时通过这套系统,我们可以跨越地理界线,共享全球医疗资源。
应用型人工智能系统之后,配合程序控制技术和机器人技术,可普及的机器人将会出现。这不由得让我们想起美国着名科幻小说家、科普作家艾萨克·阿西莫夫(Isaac Asimov)警惕性的提出的机器人学三定律:
第一定律:机器人不得伤害人类个体,或者目睹人类个体将遭受危险而袖手不管;
第二定律:机器人必须服从人给予它的命令,当该命令与第零定律或者第一定律冲突时例外;
第三定律:机器人在不违反第零、第一、第二定律的情况下要尽可能保护自己的生存。
LawⅠ:A ROBOT MAY NOT INJURE A HUMAN BEING OR, THROUGH INACTION, ALLOW A HUMAN BEING TO COME TO HARM.
LawⅡ:A ROBOT MUST OBEY ORDERS GIVEN IT BY HUMAN BEINGS EXCEPT WHERE SUCH ORDERS WOULD CONFLICT WITH THE FIRST LAW.
LawⅢ:A ROBOT MUST PROTECT ITS OWN EXISTENCE AS LONG AS SUCH PROTECTION DOES NOT CONFLICT WITH THE FIRST OR SECOND LAW.
阿西莫夫认为,在制造机器人前,需要为机器人设定这三条不可冲破的定律,机器人才能投入使用,否则会产生灾难。这三条定律在今天看来,不管在逻辑上还是使用场景上都出现了新问题,当前我们认为只有第二条可以履行,第一条和第三条都是难以履行的。比如,DARPA(Defense Advanced Research Projects Agency美国国防部先进研究项目局)研制的战场机器人,除了执行人道主义和医疗任务的机器人外,其他的战场机器人都是以杀伤地方战士为目的的,如果严格按照阿西莫夫提出的机器人学三定律制造机器人,那打败机器人军团的方法将极其简单——像战场投入人类士兵,不战而屈人之兵。
当然,AlphaGo这么聪明,它一定会夺走我们的工作机会,汽车出现后,马确实显得有点多余,但人类发展这么多年,技术不断进步,最令人欣慰的是我们一直看到,伴随老的机会消失,新的机会总是在不断出现。如果这一切无法避免,那我们应该规划更美好的未来。
选自科技人文畅销书《机器70年》
作者 徐曦
最后更新:2017-10-08 01:03:16