547
机器人
衡水籍科学家王金桥:发明“看脸”机器人!
王金桥和脸识别机器人“小加”准备上节目。 资料图片
阅读提示
未来,就这么来了。
曾出现在科幻小说中的一幕幕,现在触手可及:手机支付覆盖到菜市场和煎饼摊,计算机战胜多位人类顶尖棋手……
如今,又一项新的科技应用迎面走来,那就是脸识别技术。
不久前,央视的一档科普节目中,有“中国脸识别机器人之父”之称的河北饶阳籍科学家、中科院自动化研究所研究员王金桥,带着一台脸识别机器人“小加”亮相,在观众的惊呼声中,完成了从18只高度类似的比熊犬中识别指定犬的挑战。
脸识别是人工智能的一部分,以之为代表的人工智能,正大量应用到我们的生活中。
关于人工智能,关于人脸识别,关于科学家,记者带着诸多好奇,在北京采访了39岁的王金桥。
脸识别,机器人,放在前几年,中科院自动化研究所研究员王金桥的研究领域,对大多数普通人来说,可能更多还是与科幻电影联系在一起。
从小立志当科学家?从小接触科技知识?见到王金桥前,记者不免有各种猜想。王金桥对此的回答却是摆手大笑,“我高中、大学放暑假,都是回饶阳老家帮忙种地,割过麦子,收过棉花,从来没想过有一天会从事现在的工作。”
从农家子弟到“中国脸识别机器人之父”
进入王金桥办公室前,一出电梯,可看到墙上挂着两块招牌:一个是智能媒体计算联合实验室,一个是视频大数据云识别联合实验室。
39岁的河北饶阳人王金桥,是这两个实验室的主任。
但直到今年7月在央视录制《加油!向未来》之前,专业以外,普通人对王金桥和他的研究知之甚少。
而正是在那次节目中,王金桥带队研发的脸识别机器人“小加”,面对18只体型颜色一致、长相堪称“复制”的比熊犬,从中快速识别出3只目标犬,完成了一次漂亮的脸识别。
也是在那次节目里,王金桥被称作“中国脸识别机器人之父”。
在中科院,王金桥还有另一个头衔:自动化研究所模式识别国家重点实验室研究员。这个国家重点实验室,被公认是中国人工智能领域最尖端的研究机构。
“模式识别”指的是什么?它与王金桥所研究的脸识别之间又是什么关系?
王金桥推推眼镜,不紧不慢地解答了记者的疑问:模式识别是通过计算机,用数学建模方法,来研究模式的自动处理和判读,是人工智能的重要组成部分。他所在的这个国家重点实验室,下设三维重建、语音、图像和视频分析、翻译、医学图像等七八个小组,王金桥在图像与视频分析组,主要从事脸识别和目标识别研究。
几年前,王金桥回饶阳老家过年,常有村里人打听他在北京“研究啥”。当他回答说研究模式识别时,村里人都是先一愣,若有所思地“哦”一声,这个话题就结束了。
央视节目播出后,老家的好几个亲戚给他打电话说,“现在才知道,原来你鼓捣的东西这么厉害!”
多年“养在深闺”,一朝“惊艳世界”。
这也难怪。脸识别作为模式识别的一种应用,是在计算机技术进步和高清摄像技术的发展下才迎来了春天。
事实上,这项技术早在20世纪五六十年代就进入科学家的研究领域,但直到20世纪80年代,人脸识别还停留在研究阶段。到20世纪90年代,人脸识别才在欧美国家进入初级应用阶段。
2004年,王金桥硕士毕业后,考入中国科学院大学攻读博士,研究的方向细化为模式识别和智能系统。这个曾经是全县高考状元,本科入学时却因专业调剂才与电子技术接触的年轻人,由此幸运地走向了脸识别研究的前沿。
电脑、机器人,是如何做到脸识别的呢?
请教王金桥这个问题时,记者特别担心他说出来一番高深的理论。王金桥又笑:“最近问这个问题的记者很多。”
“那您会烦吗?一遍遍解释。”记者问。
“不会,科学的内容包含答疑解惑。”
王金桥笑着解释,脸识别是人工智能的一种应用,最初的应用也并不是专门识别人脸或动物的面孔,而是通过人类手工设计的特征来分析辨别物品。比如通过车辆长宽高等信息来识别车辆特征,“但随着车辆品牌、种类的增多,手工输入忙不过来了,科学家开始尝试让机器学会自动去分析查找车和车之间的差异。”
电脑、机器人的这种识别能力,不像人类识别那样容易受到情绪、精力的影响。2014年,脸识别技术在人脸识别的精度方面,第一次超过人类97.53%的平均水平,达到98.52%。2016年,人工智能在图像分类任务中的错误率已降至4.94%,而人眼辨识的错误率约为5.1%。
这,是否意味着人工智能已经战胜了人类呢?
王金桥笑着摇摇头,人类大脑的思维过程是一个复杂的生物启发的神经活动过程,而电脑是数据驱动的机械过程,即便机器在某些方面超越了人类,但这种超越人类是限定领域的,不能说机器比人厉害。
“未来会出现机器人为人类工作,但最终是人类在控制机器。人工智能确实在近几年有了飞速发展,但也没有人们想得那么夸张。换句话说,机器的感知能力在特定领域能超越人类,比如比人类更能注意到某些细节,但理解能力还是短板。至少目前我的机器还不能自己研究出微积分。”王金桥大笑。
王金桥带领团队研制人脸识别自动闸机。 记者 张昊摄
揭开人工智能应用的“冰山一角”
科学家这个职业,在普通人眼里,总是有点高冷,好像很有距离感。但他们创造的未来却离我们越来越近。
人工智能被誉为人类的第四次工业革命:无人驾驶已经测试了多次,机器写的新闻也已经上了头条。每一次工业革命都带来人类生产生活方式的巨变,人工智能又会带给我们什么呢?
中科院自动化研究所一楼有一个刚刚开始营业的无人零售店,安装在超市的摄像头,会自动对顾客拿起来的货物进行跟踪扫描,在顾客走到门口时看看屏幕,后台会核算出顾客取走货物的价格,顾客结算即可离开。
这个“刷脸”的零售店,对王金桥他们的脸识别技术来说,只是“小试牛刀”。
研究内容曾经让老家乡亲听得一头雾水的王金桥,现在已经有了很多活生生的应用案例。被问起脸识别的具体应用,王金桥推推眼镜仰天思考了一下:“太多了,我得想想。”
他们最近研发的项目在和国内一家企业合作,能对进入店面的顾客进行跟踪分析,从顾客进店开始,其行走路线、在哪一个商品前停留时间较长、时间多久,机器都会自动分析,从而协助商家调整货物的摆放,对特定性别、年龄顾客进行精准营销。
“在过去,商家只能统计销售数量,并不能对顾客群体进行分析。现在对收集的图像数据进行处理后,就有助于生产企业调整设计和销售方案。”王金桥不无得意地说,“这都是以前实现不了的。”
那表情,更像是夸自家的孩子。
除此之外,脸识别还广泛地应用到身份认证,比如北京西站已经开始启用的自动检票闸机,乘客把身份证和火车票送入闸机口,看着摄像头几秒,设备就会自动将身份证上的图像和乘客本人进行核对,这个过程的识别精度和准确度都要高于人工检票。
打开了王金桥的话匣子,关于脸识别的应用几乎是“滚滚而来”。“今后还能在入住宾馆、柜员机取款、贷款办理等很多方面使用,比如可以避免银行卡被盗刷、住宿者人证不符等。”王金桥介绍。
在科幻电影中,我们经常能看到这样的一幕:主角在人潮如梭的街道上奔跑,有摄像头始终锁定他的身影,记者询问这是否也是一种识别,得到了王金桥肯定的答复。
“用以图搜图的方式,通过视频结构化,把视频中的每个人都提出来,把所有人出现的时间记录下来,建立一个索引,比如找一个穿蓝色衣服、牛仔裤、长头发的人,系统就会自动能将这个特征的人找出来。”担心记者听不明白,王金桥边说边比画,甚至用手在桌面上画着图。
说到这些内容的时候,王金桥会一改讲脸识别理论时的“老师”状态,略微有点亢奋,语速也会加快。他又举了一个应用,用在小区的门禁上,每一名住户采集信息后,不用刷门卡,通过摄像头直接采集信息自动比对,甚至可以对特定人员设置黑名单,禁止进入某些区域。
而脸识别还只是人工智能的“冰山一角”。
“有些人工智能是可以预测的,有些是未知的。未知的世界才叫未来。”
“这是一个最好的时代,中国的科学家不应该被落下”
在全球人工智能领域,中科院自动化研究所的科研水平能排第七,王金桥所在的重点实验室更是该所科研能力最强的实验室之一。
所以,在进入自动化所的办公大楼前,记者对即将到达的办公室充满了期待,在想象中,研究此类高科技的科学家们,办公室应该非常“高大上”。
事实上,王金桥和同事们办公的硬件虽然一流,但工作场地并没什么特别。和大厅里学生们的办公桌位比,他和同事共用的办公区也就多了一扇门,不到10平方米的空间里,堆满了各种资料,一块黑板上还留有推演数据的符号。
王金桥说,他每天上下班也是背着双肩包挤地铁,平时得点空儿,也爱看看《芈月传》之类的流行剧。“就是总加班,看得不多。”
其实,对王金桥来说,加班往往比不加班更正常。“有时候陪着设备‘跑数据’,不知不觉就到半夜了。这个行业竞争太激烈,一‘跑’起来自己都不知道要‘跑’到什么时间。”王金桥说。
“跑数据”究竟是什么样的?
“比如训练机器识别人脸,需要对5000多万的照片进行计算,识别车型需要1000万辆以上的数据。”王金桥说,这些数据在电脑后台进行计算,在几百层程序里一遍遍地走,每一层都要进行计算,算完后把误差传回来再进行下一轮计算。“这个过程至少要一百万次,等到误差不变的时候,数据稳定了,模型稳定了,才可以用这个数据。所以要有人一直盯着。”
有时候,加班不是因为“跑数据”,而是和学生们讨论问题,“往往一不小心就聊到了深夜”。
在王金桥的办公室外,一间连一间的小格子间里,一张张年轻的面孔紧盯着屏幕,轻敲键盘。这些来自各大高校的尖子生,都是王金桥的学生。作为一名人工智能领域的老兵,王金桥32岁时就开始在中国科学院大学带研究生。
“相比上一代中国科学家,我们这一代、我们的下一代,工作条件已经好太多太多,我们唯一担心的是被世界落下。”王金桥说,来自行业内的竞争压力是外人无法想象的。
所以王金桥和同事、学生的一天往往这样开始:早8时到办公室,先开电脑看看头一天世界同行的科研进展。
毕竟,这个领域几乎每天都有几十篇论文新鲜出炉。
“过去主要是科研院校之间的竞争,现在已经变成了上市公司之间的竞争。这些公司用高薪挖走了大量的科研人才,并将技术民用化,加快了技术推广,也加剧了竞争。现在,人工智能领域技术迭代非常快。”
王金桥说,十年前,作为人工智能领域的A类会议,CVPR(国际计算机视觉与模式识别会议)一年收到三四百篇论文,现在一年会收到七八百篇,原来参会的人数大几百,现在好几千人。
各国都在增加针对人工智能领域研究的投入,拼人才更拼速度。
“有时候打开电脑一看,这边研究了一年多的一项技术,论文还在写,那边已经有同行论文发表了。”即使这样,王金桥他们也顾不上沮丧,而是要赶紧研究同行的论文对实验结论进行复现。哪怕论文中只提到一个思路、一个框架、几个公式。
“复现的目的,就是做出来之后,再比对方做得更好,超过对方。”王金桥说得心平气和,“科学就是这样,一层层迭代,像车轮一样,你总是站在别人的肩膀上,一点点往上走。”
王金桥的年薪并不高,甚至远不如他刚毕业的学生,之前也有上市公司向他伸出过橄榄枝,但王金桥还是决定留在所里,“国家出台了各种支持措施,让科学家在专心科研的同时也能照顾口袋,给了科学家更宽松的科研环境。”
“对于人工智能来说,这是一个最好的时代,中国的科学家不应该被落下。”王金桥又推了推眼镜,眼镜后面那双眼睛,坚定又热烈。(记者 白云)
记 者
手记
期待涌现更多“科学偶像”
20世纪70年代末,报告文学《哥德巴赫猜想》,让数学家陈景润成为时代偶像。一时间,全社会对科学家的追捧达到了空前的高度,每天都有很多来信送到中科院数学研究所。
当时,很多中小学生的理想是长大了当个科学家。
尽管这种热情一度遭遇收入上的“脑体倒挂”,但几十年过去,如今,航天飞船上了天,高铁遍地跑,手机支付只需扫一扫,网上叫车实现了精准供需……看看这些正在我们身边发生的翻天覆地的变化,任何人都不得不承认,科学技术是第一生产力。
与此同时,几十年的经济建设,也使我国进一步具备了科学普及的基础:中等教育的普及,高等教育面进一步的扩展,使整个社会的科学素养全面提升;网络的便利,传媒手段的升级,使人们有更多的渠道和更好的条件,去全方位接触和了解科学技术。
我们这个时代,比任何时候都需要,而且可以,把更多的科学家推到台前。
我们期待涌现更多的“科学偶像”,引导年轻人的兴趣爱好,带动更多的人投身到科学的怀抱,来建设我们的国家,让他们的电子化世界里,不再仅仅充斥明星和游戏。我们更期待让更多的普通人了解那些渗入生活改变世界的技术,从何而来,由谁发明,又是怎么实现的。
曾笼罩在科学家身上的神秘面纱,正在悄然揭开。
最近,各大卫视纷纷上线科学栏目,《极客智造》《我是未来》《加油!向未来》……参加过节目的部分嘉宾已经成了新的“网红”,他们展示的炫酷技术也成了网络上热议的内容。
现场很多观众都是中小学生,他们能得到面对面的讲解、观摩最前沿的人工智能产品,我们有理由相信,这是培养孩子们科学探索精神的“正确打开方式”。
王金桥也已经收到多家电视台邀请,并为不同的节目精心设置识别环节,甚至要给机器人“小加”改头换面,避免观众产生视觉疲劳。
和小时候从没想过会研究图像识别一样,王金桥也从没想过像他这样的科研人员会因为技术而走上舞台。但他非常乐于去做这项耗时的工作,也包括到学校去给孩子们讲课,“这一行业的人才太少了。我们国家需要更多的研究人员。”
在今年的研究生招考中,中科院自动化研究所有3000多人报考,只有200多人拿到了复试通知,最后70多人过关,竞争可谓惨烈。
“这几年是各国研究人工智能最较劲的几年,各国也都把人脸识别提高到国家战略安全的高度,我希望有更多的优秀人才投身到这一领域,提高我们国家的国际竞争力。”这是王金桥的理想。
毕竟,未来,是为我们每个人而来。(文/白云)
来源/河北新闻网
最后更新:2017-10-21 10:33:20