284
机器人
人工智能的“芯”路有何门道,看这三点就够了
史上最热剧《冰与火之歌》第七季终于演变到“冰”与“火”的第一次正面对决,而人工智能AI掀起的“第三次世界革命”才刚拉开帷幕。Google、亚马逊、微软、英特尔、英伟达、百度等诸候争霸,角逐AI芯片,这样的战局像极了《冰与火之歌》的“七国”与“N大家族”,“统一”之路充满想象。
01
深度学习成AI芯片着力点
对于AI来说,除了大数据和深度学习算法之外,芯片的重要性在于为客户产生“实用”价值,无疑是极其重要的。
到2020年,全世界会有500亿设备互联,大量的数据和计算在云端“完成”,AI芯片要加以“成全”。而随着智能的需求无所不在,更多数据的采集和计算都将在前端设备(边缘计算)进行,前端智能已成一大趋势,AI芯片也成为支撑前端智能不可或缺的载体。正如同以后每一台无人驾驶汽车都将是一台服务器,每台车每天会有超过4000个GB的数据,这些数据都不可能通过5G来传输,很多数据是在本地处理和分析然后选择性的上传,本地会使用很多AI,甚至超越服务器。
这对于AI芯片来说既是一大契机,也是一大挑战。毕竟在云端服务器芯片,可以在成本和功耗方面有所折衷,在前端则需要成本、性能和功耗的重重优化。
随着数据量和计算力的提升,深度学习的性能和学习精度得到很大的提升,被广泛运用到文本处理、语音和图像识别上,成为AI芯片的着力点。
对于深度学习而言,训练集用来求解神经网络的权重,最后形成模型;而测试集则用来验证模型的准确度。AI芯片既需要完成训练和测试的“双重”使命,处理大量的数据,需要高带宽,同时具备高效率,包括计算效率和编程效率,并能面向广阔的应用(包括语音、语义、图像、视频、自然语言多模态处理能力),这殊非易事。
02
是同构一统江湖,还是异构互促互进?
这也是为什么大拿们的AI芯片,无论是什么炫目的“XPU”,不外乎现成的CPU、GPU、FPGA和DSP的各种组合。比如微软的“脑波计划”DPU支持多种 FPGA,英伟达的Tesla 深度学习处理器则脱胎于GPU,而强大者如Google直接做成了ASIC,比如Google的TPU(张量处理单元),已经开发出了第二代,每颗带宽 600GB/s,算力达到 45 TFLOPS (8位整数)。
国内层面,百度的XPU本质是 FPGA,和Xilinx 合作。华为的AI芯片9月2号就要正式亮相,据悉将集CPU、GPU和AI功能于一体。此外,寒武纪、地平线机器人、华为海思、深鉴、云知声等也在全力比拼。
这些厂商的AI芯片有的力拼云端,有的宣称可支撑端到端,比如英特尔就是通过多元化的产品线加强部署,FPGA、Xeon Phi 都面向云端数据中心,而日前发布的VPU(视觉处理单元)配备了专用神经计算引擎,着力为边缘设备提供高端智能计算,旨在成为无人机、智能相机、VR/AR头显,360度摄像机的“砥柱”。
层出不穷的架构,名目繁多的引擎,构建了目前AI芯片的“百家争鸣”,到底谁将胜出?是同构一统江湖,还是异构互促互进?这些架构各有其优劣势,或许需要分而治之,并要长“治”久安。
比如在云端服务器,CPU、FPGA、GPU等可以“并行战斗”,而在前端,或许CPU+AI加速引擎会更加“实际”。NVIDIA曾表示,深度学习需要很高的内在并行度、大量的浮点计算能力以及矩阵预算,而GPU可以提供这些能力,但其缺点是更高的功耗。FPGA非常适合矩阵乘法,它的可编程性增加了一些必要的灵活性和面向未来的设计,内置DSP模块和本地存储器的FPGA会更节能,但它们通常更加昂贵。而且,AI芯片也是算法和硬件需要共同“精进”的领域。
这也引出了另一个命题,这不仅是架构自身“风云际会”的较量,更将走入算法、指令集和IP融合等生态竞争层面。
03
进化和生态是关键
第一代AI芯片既需要不断的迭代进化,更需要加快生态的构建。毕竟一个易于部署的平台和良好的生态环境,包括一些基于硬件优化的开源工具对于AI芯片的应用是大有裨益的。
有专家指出,芯片的成败,除了本身的效率之外,生态是非常关键的环节。过去ICT产业的软硬件生态都是建立在ARM和x86指令集之上的。不遵从这些指令集,芯片做得再好,没有配套应用和软件,亦很难在市场上获得成功。而未来的智能时代,可能格局会发生巨大变化,会出现新的AI生态。
而生态的核心还是AI指令集。有专家说,没有AI指令集,AI芯片应当如何规范化设计,AI软件如何和底层硬件交互,都是无根之木。寒武纪Cambricon-X指令集是其一大特色,目前其芯片IP已扩大范围授权集成到手机、安防、可穿戴设备等终端芯片中。最新报道寒武纪又融了1亿美元。
此外,AI在诸多市场都有应用,所有这些都需要从工具、到IP再到开发平台的巨大发展,从而不断优化来提高功率、性能和成本。比如GPU已经构建了CUDA、cuDNN及DIGITS等工具,支持各种主流开源框架,提供友好的界面和可视化的方式,并得到了合作伙伴的支持。
就像早期版本的物联网器件一样,没有人知道各类市场如何演变。在某个领域里有效的AI技术(如视觉处理)不一定适用于另一个领域。而随着针对这些特定应用的新芯片的开发,功耗和性能会实现平衡,方法是更有针对性的功能、本地处理与云处理之间更智能的分布、以及对于设计中的瓶颈的更深入的理解这三者的结合。AI为芯片行业按下了“重启”按钮,未来也将“八仙过海,各显神通”。
本文为智慧产品圈原创,转载请联系本公众号获得授权。
作者:李映 智慧产品圈资深编辑
-----------------------------------
-----------------------------------
智慧产品圈联合深圳市智慧家庭协会、思锐达咨询,举办2017年智能门锁与智慧酒店公寓落地高峰论坛。本次活动,旨在推广真正具有技术含量和创新力的好技术、好产品、好品牌、好服务。我们严重鄙视孤芳自赏,来吧,show出你的freestyle!
最后更新:2017-09-02 18:03:43