阅读694 返回首页    go 机器人


中国信息通信研究院许志远:人工智能的革命对于方法论的影响非常深远

许志远在演讲中表示,人工智能的革命对于方法论的影响是非常深远的,远远超过了大数据。他指出,互联网和移动互联网诞生了大量的数据,把数据作为输入、作为训练的原料,把通用的深度神经网络做成一个通用模型去模拟、去逼近世界最终的图景,并且适用于任何领域。

许志远表示,人工智能的产业规模和影响力能达到700亿美元,人工智能并不是一个独立的产业,它是一个基础还没有形成实体,它只是应用。在未来的阶段里面,有可能人工智能去形成这样的机器人,像智能手机大规模的应用渗透到社会的方方面面。

从人工智能整个产业体系来讲,许志远认为有五个大的关键要素和环节:芯片、数据、开发的框架、算法到应用。

在端侧这一块,人工智能对于芯片的需求是很强烈的;

数据,没有数据今天的模型是得不到有效的算法;

开发框架,Google公司TensorFlow在产业中的地位很快可以建立;

算法,数据驱动技术学习的算法占据了绝对的主导。

应用这一块,人工智能真正的进入万物智能的时代,需要非常长的时间。如今像家居、交通、医疗、金融等等领域已经获得非常广泛的应用。

以下为许志远演讲实录:(经创客猫编辑,有所删减)

许志远:

各位领导、各位嘉宾,很高兴到上海来和大家交流。首先我想跟大家还是探讨一下对于人工智能这一次发展浪潮的认识。

实际上这一次浪潮,说人工智能其实90%的情况下说的是深度学习,人工智能的革命说的是深度学习的革命。深度学习在绝大多数的情况下,说的也是以深度神经网络为基础的学习,我认为它是人类解决问题方法论的重大变化。前面一段时间也有很多人说人工智能的炒作或者说泡沫很大,未来可能会在很快的时间破灭。我的观念,就是对这样论断的回应,你如果是人类解决问题方法论重大的变化,它对于整个人类社会的意义可能会超出人的想象。什么样的方法论呢?如果我们回顾一下,从大数据开始,其实方法论已经有一些变化了,大数据其实是用于一种所谓的相关关系来替代人们没有研究透的因果关系。最典型的例子Google通过人们搜索的有关感冒的信息,或者药的一些信息来断定流行病感冒病的爆发,这其实是用相对不是明确的因果关系,相关关系来替代对因果关系的判定。

这一次的人工智能革命,它对于方法论的影响是非常非常深远的,应该说远远超过了大数据。它是什么呢?实际上用一种相对的通用的,或者说相对预定的神经网络的模型来做通用的工具,我们从小到大学到很多的理论和知识,比如说牛顿的三大定律,比如说爱因斯坦的质能方程,这一些理论的突破是人类理性的成果。但是我们大家都知道,人类理性的成果,或者说理论的突破是相当相当困难的。你可能过去几百年里面才有这么多的突破,最重大的突破一百年可能会有,至少几十年可能都不会有一个。在这种情况下,由于互联网和移动互联网诞生了那么多大的数据,在这种情况下,我们用这些数据作为输入、作为训练的原料,把通用的深度神经网络做一个通用模型去模拟、去逼近世界最终的图景,这种通用的工具无往而不胜,放在任何的领域都可以。你也可以认为是耍赖的方式,我不管描述任何的图景都是用这个模型,我觉得这是非常了不起的。你如果做一个通用的工具,它对于整个人类社会就可以去类比,蒸汽机、电力或者电子的一些技术,如果作为人类通用的工具,会产生颠覆性产业的变革,我觉得这个意义是非常重大的。当然它也可能有一些负面的影响,你无论做多少的数据分析,你做多复杂的深度神经网络,你也不可能去能够得出牛顿三大定律,也不可能得出爱因斯坦质能方程非常精巧的模型,那是不可能的。你只能说你的模型越来越复杂,但是不管怎么样,人类理性或者人类的理论在很多的领域都能得到突破的情况下,有这么一个通用的模型我觉得是非常幸运的,而且可能是奏效的。

说到产业规模和影响力,刚才讲的700亿美元,700亿美元多吗?700亿美元肯定不多,咱们国家电器制造业都十几万亿。实际上落实到人工智能来讲,整个的产业规模从目前来讲其实并不是很大,因为它并不是一个独立的产业,它很基础,还没有形成所谓的实体。其实我觉得在业界目前来讲,谈真正的人工智能的应用在90%或者说我说的有点极端,70%到80%的情况下说的不是机器人,它只是应用。实际上今天机器人还无法作为单独的像智能手机规模庞大的实体,去做一个应用和互联网的入口,今天它做不到。所以我们说今天可能是属于人工智能在背后跑我们看不到的起作用的阶段。在未来的阶段里面,有可能人工智能去形成这样的机器人,像智能手机大规模的应用渗透到社会的方方面面,我觉得那可能会成为一个入口。现在显然这个条件还不完全具备。所以说人工智能你如果单独去看它的规模可能没有那么大,但是它对于ICT,对于整个世界的影响,如果上升到方法论的高度,它就是非常非常重要,也甚至是颠覆性的。从小的方面来讲,今天的人工智能是颠覆编程的架构,人工智能不是一个系统,它是一个设计的架构。训练和部署又都不一样。

对于整个信息通信产业体系来讲,我觉得对人工智能的改变是什么呢?它增加了信息通信产业的层次,这个意义是很重要的。原来我们知道像终端、网络、云管端,再加上产生的大数据,这四层当然还有应用服务,五层构建了整个信息通信的整个体系。但是我们看人工智能出来以后又增加了一层,你每增加一层,对于整个的信息通信,整个的ICT产业都是非常大的影响。这一层就是数据的清洗、标注、AI数据训练、模型生成,带来全方位的影响。另外来讲,产业的智能性是无可置疑的,你不可能迈过大数据和云计算谈人工智能,不可能的。你必须得有数据才能生成有效的算法模型。你必须有云计算、大数据再到人工智能,而目前人工智能的训练绝大多数都是在云端的,所以这也是一个产业的发展数据,你是很难迈过的。

再通俗来讲在座各位有可能是人工智能专家,也有可能不是。不是的话,我形象给你们解释一下今天的人工智能为什么不是一个应用系统,如果拿Android的移动互联网来讲,我们通过人工智能得到的算法相当于Android应用,这个比喻是比较形象的,所有人都能明白,今天所有人都在使用智能手机。架构上也是类似的。很多院士他们讲的太高大上了,我讲的稍微细一点。

从整个产业体系来讲,我个人觉得有五个大的关键的要素和环节。从芯片、数据、开发的框架、算法到应用,这是我认为它有五个要素,云侧和端侧还是不一样的,一致性用同样的方式对待会出问题。我们首先看云侧,从我个人来讲,如果非常远的角度看云侧训练的芯片难度是非常高的,网络来讲它是更大的SOC的方向发展,你需要了解CPU,需要了解FPGA,需要了解GPU,需要了解Google最新推出的全新一级的TPU,需要了解的太多了,需要具备的能力太强了。当然这应该是英特尔最终的优势,但今天大家可能做的NPU是基于某一个角度做的,而不是大而全的合集,那个难度太高了。里面具体的技术我就不再班门弄斧了,因为有很多架构的创新,包括和存储之间的关系,你怎么去提升互联的效率,怎么进行算法的融合,以及基于深度神经网络的精度的计算。今天深度神经网络从根本上来讲是概念的模型,而这种概念的模型你在不同的分支的情况下你是可以做低精度计算。

在端侧这一块,人工智能的需求,芯片的需求还是很强烈的。至少还有三个,一个是实时响应,就像无人驾驶汽车,今天的无人驾驶汽车是非常昂贵计算的设备和存储设备。它要满足一个实时响应的需求。还有一个是语音和图像,语音这一块计算的能力是没有问题,但是存储基本上在云端。图像这一块,应该说是未来一段时间很快了,手机进行人工智能处理很重要的需求。因为它要进行高清的惊细度图像的重建、去污、重造各种各样对图像的处理,它是需要中端侧人工智能的芯片,或者说支持网络的芯片,这是通信的需求。未来大家掏出来自己的智能手机,对于图像的处理的效果就能够证明你的手机是不是支持人工智能。还有一个是信息隐私,这个不多讲了。

数据,数据这一块大家比较清楚,没有数据今天的模型是得不到有效的算法,今天根本是做不到的。当然这个数据有很多种观点。比如说它必须是海量的,而且它需要标注,绝大多数是需要标注的。而且人类的知识,谈到这种模型挺有意思的在于什么呢?你这种模型和知识图谱或者说和你人类知识的结合,可能很多的时候是在标注这个环节。到中间训练的时候已经接合不上了,或者说今天的很多算法你是接不上的,成为一个黑箱。换句话说你今天判断你是不是人工智能,我们用另外一个说法,如果程序员都不知道这个程序是怎么造的,可以认为某种意义上是人工智能,当然这是开玩笑的说法。还有一些是结果数据,更多的情况下需要各种数据,另外需要反馈数据,增强学习的一些算法。

开发框架,有很多的公司在做。也有很多的方式,我觉得Google公司TensorFlow在产业中的地位很快可以建立,很快可以发布了,跟上层的应用打通了。目前来讲在端侧来讲,只有Android或者是Google能够建立这样的平台,别人建立不了。换句话说刚才的框架怎么跟它竞争我不知道,不知道怎么竞争。

算法,大家有各种各样的想法,我个人认为数据驱动技术学习的算法占据了绝对的主导。先验和知识引导的知识工程,不像深度学习数据驱动的算法。类脑智能来讲,在绝大多数的情况下都是伪命题,在理论没有突破的情况下,在中国研究几十年的东西,我不知道允不允许这么干。

最后是应用,应用这一块,因为你真正的要进入万物智能的时代,需要非常非常多的时间。但是今天无疑像家居、交通、医疗、金融等等领域已经获得非常广泛的应用。外面展示厅有很多的展示,大家看到很多的应用,我觉得确实是今天的工程其实已经超越了科学,走的步伐已经领先于科学。很多的应用它能够起作用,当然我们可能还不知道它为什么起了作用。

最后,跟大家总结一下。我觉得从今天的产业体系来讲是非常非常复杂的,它的产业链更长,人工智能对于整个产业链的影响是全方位的。从产学研的关系来讲,今天学界和工程界是联系非常紧密的。这里面有一个观点,我认为这一次的人工智能的深度学习的革命是突然爆发的,所有的人几乎都没有想到。也就像有一个大的互联网公司跟我抱怨说GPU太贵了就不降价,它一枝独秀,包括英特尔。从渗透路径来讲,还是从商业、行业开始逐渐到个人领域,这个过程会很快。从发展阶段来讲,我觉得所有领域包括芯片、终端、算法、软件、应用的主导者还没有那么明确。但是开发框架的主导者很快就明确了,当然我们说芯片的主导者是谁,一切皆有可能。应用领域来讲只要有数据就能够应用。我就讲到这,谢谢大家。

文丨创客猫 小指

以上,创客猫现场报道,如有转载请注明来源

最后更新:2017-09-09 20:21:10

  上一篇:go 人工智能到来,我们的工作是否都要被“它”夺走了?
  下一篇:go 2017双创周深圳活动15日开幕,设317个展位,无人机、机器人等顶尖科技全都有