160
技術社區[雲棲]
人工智能芯片FPGA與ASIC的產業分析
隨著人工智能產業鏈的火速延伸,GPU並不能滿足所有場景(如手機)上的深度學習計算任務, GPU並不是深度學習算力痛點的唯一解。目前以深度學習為代表的人工智能計算需求,主要采用GPU、FPGA等已有適合並行計算的通用芯片來實現加速。
FPGA人工智能芯片.jpg
在產業應用沒有大規模興起之時,使用這類已有的通用芯片可以避免專門研發定製芯片(ASIC)的高投入和高風險。但是,由於這類通用芯片設計初衷並非專門針對深度學習,因而天然存在性能、功耗等方麵的瓶頸。隨著人工智能應用規模的擴大,這類問題將日益突出。
一項深度學習工程的搭建,可分為訓練(training)和推斷(inference)兩個環節:訓練環境通常需要通過大量的數據輸入,或采取增強學習等非監督學習方法,訓練出一個複雜的深度神經網絡模型。訓練過程由於涉及海量的訓練數據(大數據)和複雜的深度神經網絡結構,需要的計算規模非常龐大,通常需要GPU集群訓練幾天甚至數周的時間,在訓練環節GPU目前暫時扮演著難以輕易替代的角色。
推斷(inference)環節指利用訓練好的模型,使用新的數據去“推斷”出各種結論,如視頻監控設備通過後台的深度神經網絡模型,判斷一張抓拍到的人臉是否屬於黑名單。雖然推斷環節的計算量相比訓練環節少,但仍然涉及大量的矩陣運算。在推斷環節,除了使用CPU或GPU進行運算外,FPGA以及ASIC均能發揮重大作用。
FPGA(可編程門陣列,Field Programmable Gate Array)是一種集成大量基本門電路及存儲器的芯片,可通過燒入FPGA配置文件來來定義這些門電路及存儲器間的連線,從而實現特定的功能。而且燒入的內容是可配置的,通過配置特定的文件可將FPGA轉變為不同的處理器,就如一塊可重複刷寫的白板一樣。因此FPGA可靈活支持各類深度學習的計算任務,性能上根據百度的一項研究顯示,對於大量的矩陣運算GPU遠好於FPGA,但是當處理小計算量大批次的實際計算時FPGA性能優於GPU,另外FPGA有低延遲的特點,非常適合在推斷環節支撐海量的用戶實時計算請求(如語音雲識別)。
ASIC(專用集成電路,Application Specific Integrated Circuit)則是不可配置的高度定製專用芯片。特點是需要大量的研發投入,如果不能保證出貨量其單顆成本難以下降,而且芯片的功能一旦流片後則無更改餘地,若市場深度學習方向一旦改變,ASIC前期投入將無法回收,意味著ASIC具有較大的市場風險。但ASIC作為專用芯片性能高於FPGA,如能實現高出貨量,其單顆成本可做到遠低於FPGA。
FPGA的靈活性,很多使用通用處理器或ASIC難以實現的下層硬件控製操作技術利用FPGA可以很方便的實現,從而為算法的功能實現和優化留出了更大空間。同時FPGA一次性成本(光刻掩模製作成本)遠低於ASIC,在芯片需求還未成規模、深度學習算法暫未穩定需要不斷迭代改進的情況下,利用具備可重構特性的FPGA芯片來實現半定製的人工智能芯片是最佳選擇。在眾多領域都有替代ASIC的趨勢,據市場機構GRANDVIEW RESEARCH的數據,FPGA市場將從2015年的63.6億增長到2024年的約110億美元,年均增長率在6%。
盡管FPGA倍受看好,甚至新一代百度大腦也是基於FPGA平台研發,但其畢竟不是專門為了適用深度學習算法而研發,實際仍然存在不少局限:第一,基本單元的計算能力有限。為了實現可重構特性,FPGA內部有大量極細粒度的基本單元,但是每個單元的計算能力(主要依靠LUT查找表)都遠遠低於CPU和GPU中的ALU模塊。第二,速度和功耗相對專用定製芯片(ASIC)仍然存在不小差距; 第三,FPGA價格較為昂貴,在規模放量的情況下單塊FPGA的成本要遠高於專用定製芯片。
近幾年來,定製芯片的性能提升非常明顯。例如英偉達首款專門為深度學習從零開始設計的芯片Tesla P100數據處理速度是其2014年推出GPU係列的12倍。穀歌為機器學習定製的芯片TPU將硬件性能提升至相當於當前芯片按摩爾定律發展7年後的水平。正如CPU改變了當年龐大的計算機一樣,人工智能ASIC芯片也將大幅改變如今AI硬件設備的麵貌。如大名鼎鼎的AlphaGo使用了約170個圖形處理器(GPU)和1200 個中央處理器(CPU),這些設備需要占用一個機房,還要配備大功率的空調,以及多名專家進行係統維護。而如果全部使用專用芯片,非常可能隻需要一個盒子大小,且功耗也會大幅降低。
下遊需求促進人工智能芯片專用化。從服務器,計算機到無人駕駛汽車、無人機再到智能家居的各類家電,至少數十倍於智能手機體量的設備需要引入感知交互能力和人工智能計算能力。而出於對實時性的要求以及訓練數據隱私等考慮,這些能力不可能完全依賴雲端,必須要有本地的軟硬件基礎平台支撐,這將帶來海量的人工智能芯片的需求。
朗銳智科(www.lrist.com)認為在芯片需求還未成規模、深度學習算法暫未穩定需要不斷迭代改進的情況下,利用具備可重構特性的FPGA芯片來實現半定製的人工智能芯片是最佳選擇。隨著人工智能算法和應用技術的日益發展,以及人工智能專用芯片ASIC產業環境的逐漸成熟,人工智能ASIC將成為人工智能計算芯片發展的必然趨勢。
最後更新:2017-09-06 13:04:07