阅读817 返回首页    go 阿里云


三大论文入围ACMMM,阿里云的城市大脑会是AI的未来吗?

美国计算机协会,也就是 ACM,是计算机行业里最富盛名学会之一,自 1993 年开始,ACM Multimedia (简称 ACM MM)已成为全球多媒体领域最具影响力的学术会议,也是被中国计算机学会推荐的计算机图形学和多媒体领域的 A 类会议。尤其是随着互联网的快速发展,图像、视频等影像资料越来越多,围绕上述多媒体内容的研究也变得越发重要,也因此,每年的 ACM MM 大会的论文就成为观察学术界、工业界对于多媒体发展的一个重要窗口。

在最新披露的第 25 届 ACM MM 会议资料中,共收到 675 篇论文,来自中国阿里云的三篇论文同时入围,其中有两篇论文将在 10 月份的大会上做口述报告。

纵观此次阿里云的三篇技术论文,都是阿里巴巴神秘机构 iDST 基于阿里云城市大脑项目做出的研究,内容涵盖交通事故识别、人流轨迹判断以及交通数据样本的汇总等方面。考虑到 iDST 在阿里巴巴今年启动的 NASA 中的重要作用,城市大脑也是阿里云 ET 大脑的重要落地项目,此次基于城市大脑的技术研究得到 ACM MM 的认可,不仅是对阿里巴巴 iDST 技术能力的认可,也有可能对人工智能的未来走向产生多重启示。

启示一:人工智能必须落地

「人工智能」的概念来自于学术界,长期以来都是一个学术界小圈子里的课题。过去 60 多年时间里,所谓「人工智能寒冬」也好,「盛夏」也罢,始终都是一个离工业界很远的概念或想法,直到 PC、互联网时代的到来,尤其是进入 21 世纪后的移动互联网时代,基于深度学习的人工智能才迎来一次真正意义的爆发。这一次,以互联网公司为代表的工业界认识到人工智能在产品创新与用户体验上的价值,开始疯狂「拥抱」学术界的技术、人才。

但这种狂热却在催生新的泡沫,尤其在资本涌入这个领域之后,为了「智能」而「智能」的概念、炒作层出不穷,而鲜为人知的则是,Google DeepMind 将可以下围棋的 AlphaGo 相关技术运用到数据中心节能领域,阿里云将数据、计算能力以及算法上的优势整合在一起,结合不同行业特点,先后推出城市大脑、工业大脑、医疗大脑等产品,赋能各个行业的转型升级。

以此次入围 ACM MM 的三篇论文为例,其都围绕城市大脑的项目来展开,这个项目最早公开于 2016 年的杭州云栖大会,其首要目的是解决城市发展中的交通问题,正如当时王坚博士所言:「世界上最远的距离是红绿灯与交通监控摄像头之间的距离,他们虽然在同一根杆子上,但是从来没有通过数据被连接过」。因此,从打通数据入手,并在海量、实时数据分析处理的基础上做出智能决策,是阿里云对于城市大脑的基本定位。从这个角度上说,城市大脑项目就像是一个人工智能落地的试验场,从一开始就具备了可操作性和社会价值。

启示二:技术进步来自于实践又服务于实践

技术的进步从来都是社会、经济发展相互作用的结果。某种意义上,人工智能长期以来无法得到社会认可的原因是因为其所谓进步和发展与社会经济之间是脱节的,这种来自于学术界的技术进步是无法真正适用于在现实生活的,这也成为长期以来困扰人工智能发展的主要障碍。

最近几年来,大量学术界人才涌入互联网巨头或创业公司从事人工智能研发,一方面是经济利益的考量,另一方面的原因则是,只有互联网公司才拥有海量的数据以及廉价高可用的计算能力。比如在城市交通领域,针对交通监控视频检测异常的算法中,倘若没有海量的数据做支撑以及真实场景下的评测对照,这种技术上的「进步」或许永远没有用武之处,而在同人鉴别这个经典的计算机视觉问题上,实时、海量的数据才能最大限度地提升算法性能,从而带来整个鉴别体系的升级完善。

上述两个难题恰好也是此次阿里云提交给 ACM MM 上的两篇论文主题。以交通监控异常为例,一旦监控视频里出现诸如交通事故、违章停车、车辆逆行等时间都需要及时处理,但过往的操作方式通常是人为检测,但随着城市摄像头越来越多,单独依靠人力是无法满足这些需求,阿里云的论文里提出了一种基于 3D 卷积申请网络的方式,通过对正常交通视频里的车辆行驶状况特征提取和建模,从而形成一套全新的异常状况监测系统,实际检验的结果与模拟效果非常接近。

如果车辆数秒后的运动趋势与模型产生误差,达到一定阈值后即判断为交通异常

而在对同人鉴别的研究中,深度学习的模型相比于传统方法已经有很大的提升,但是在实际生活中,尤其是城市复杂的道路上,干扰因素非常多,并不能真正还原实验室里的算法效果。阿里云的论文展示了基于真实城市道路上的同人鉴别机制,通过将前端和后端的分离,分别采用两种训练模型,既保证了算法的实时性,也有效提升了算法性能。

类似这种来自于现实社会的技术发展需求构成了当下人工智能发展的重要推动力。另一方面,上述技术发展的成果又会不断在实践中得到优化改良,阿里巴巴 iDST 副院长、IEEE 院士华先胜这样评价:「这三篇论文的研究起点都来自城市大脑的应用场景,其研究成果都将帮助到城市大脑的落地。」比如,杭州的交通状况或许和苏州又有很大的不同,而当苏州成为城市大脑又一个落地城市之后,之前来自于杭州的相关技术又要结合苏州当地的交通状况(如路网规划、交通拥堵点等)进行重新的部署和升级,这既是一次「机器学习」,也是城市管理者对于城市状况的一次学习之旅。

启示三:人工智能的探索才刚刚起步

当天才般的阿兰·图灵在 1936 年出版《论数字计算在决断难题中的应用》时,他或许不会想到,这篇论文透露出的「模仿游戏」会成为接下来一代代聪明头脑为之奋斗的目标;而当 1958 年 NASA 成立之时,或许连下定决心追赶苏联的艾森豪威尔也没有想到,这个决定会影响 20 世纪下半叶的世界进程,这一切的一切,都是根源于对未知以及对未来的探索。

当下的人工智能也处在这样的关键探索阶段。

3 月,阿里巴巴宣布启动「NASA」计划,面向未来 20 年的技术发展趋势组建独立研发部门,建立全新的管理机制,包括机器学习(人工智能)、芯片、物联网等成为「NASA」探索的领域;5月,Google 在开发者大会上宣布公司战略转向「AI First」,将人工智能作为公司内外的核心战略;7月,百度喊出「All in AI」 的口号,集全公司之力发展人工智能;也是在 7月,微软组建全新的人工智能实验室,将在机器学习、自然语言翻译方面探索新的可能性。

以上这些巨头的布局和战略调整,都建立对于技术发展的高度信仰之上,然而从公司基因与商业模式层面来看,这些人工智能的探索又有诸多不同。依托平台型经济成长起来的阿里巴巴,在人工智能领域的探索集中在「赋能」这两件事上,不管是 ET 工业大脑还是 ET 医疗大脑,其核心诉求点还是希望通过将人工智能应用在这些行业,与行业的合伙伙伴寻求共赢关系;而 Google、百度的人工智能探索则更多依靠自身工程师团队的「灵光乍现」,其产品落地能力和生态合作能力实属一般;至于微软,或许在研发层面具有超强的能力,但在一个产品成熟的公司,新技术的研发到产品出炉,是一条非常漫长的道路。

阿里巴巴集团技术委员会主席王坚发表演讲

这恰恰也是当下人工智能发展的有趣之处,它展现了新技术之于人类未来发展的各种可能性。然而正如上文所言,这枚硬币的另一面,则是各大标榜人工智能公司的产品能否落地、如何落地又如何形成社会、经济价值的反思和追问,更重要的一点,人工智能正在成长为社会经济发展的基础设施,一如当年的 PC、互联网以及近几年的云计算一样,那么如何让社会各行各业在人工智能之上进行创新,也成为人工智能未来探索的重要命题。

而在阿里巴巴这个面向政府层面的城市大脑项目里,也是由来自不同领域的多家公司共同推动实现,就像此次三篇技术论文所代表的趋势一样,技术的发展衍生出新的商业需求,反过来又激发技术创新的动力,这或许就是阿里巴巴的探索理念,不久前的全球人工智能高峰论坛上,阿里巴巴技术委员会主席王坚博士对此做了更进一步的解读:「我们要做的,是用机器解决人类解决不了的问题。在这个意义上,比起人工智能,机器智能这个词更加准确。……城市大脑不但能造福百姓,也会像登月计划一样,成为机器智能未来10年最重要的研究平台。」

最后更新:2017-08-22 10:47:50

  上一篇:go 阿里云付费用户破100万;腾讯人均薪酬40万;李强调研世界物联网博览会筹备
  下一篇:go 阿里云成中国云计算霸主 付费用户100万 年收入超10亿美元