閱讀742 返回首頁    go 機器人


人工智能計算架構的未來

關鍵時刻,第一時間送達!

近年來,伴隨著數據需求的急劇膨脹、深度學習算法和計算技術的突破,人工智能在全球範圍內掀起了一股新的浪潮。人工智能為行業帶來了深刻的變革,但同時也為 IT 產業帶來了巨大的挑戰。隨著人工智能計算的需求劇增,現有計算架構遭遇功耗牆、性能牆、內存牆、摩爾定律趨緩等挑戰,迫切需要計算架構的創新。

基於此,在昨日舉行的世界人工智能大會上,比特大陸(BITMAIN)聯合創始人、CEO 詹克團先生圍繞「AI 驅動的又一個星球級計算」發表主題演講,全麵介紹了 AI 在未來的星球級別計算的宏大數據和應用,並在現場宣布了 BITMAIN 的 AI 品牌 SOPHON(算豐),其官網 SOPHON.AI 正式上線。同時,由 BITMAIN 研發的全球首款張量加速計算芯片 BM1680 正式發布,板卡 SC1/SC1+、智能視頻分析服務器 SS1 等重量級產品也相應地量產出貨。

BITMAIN CEO 詹克團表示:“人工智能驅動了又一個星球級的計算體量,也驅動新的計算架構創新。在感知智能方麵,如圖像、視頻、語音、自然語言的識別和理解等,人工智能應用越來越深入,並不斷推動著行業的智能化變革。”

“我們堅定地看好 AI 在各行業應用場景落地,並驅動行業智能化。也正因如此,入場人工智能領域,是 BITMAIN 的重要一步。從研發數字貨幣芯片、礦機到設立礦池,比特大陸自主研發,自主布局完善產業鏈。而現在,是 BITMAIN 進軍人工智能行業的最佳時機。BITMAIN 致力於通過強大的芯片工程、快速迭代和係統設計製造能力,提供最具性價比、最具性能功耗比的 AI 計算力,同時致力於為行業定製、優化全棧的硬件和係統方案,從而極大降低行業+AI 的難度,促進 AI 普及。”

“比如我們今天發布的完整的服務器產品 SS1,基於自主研發的芯片和板卡,集成了視頻智能分析算法,用戶可以開箱即用的方式實現人臉人體檢測、視頻智能分析功能,通過調用算法 API 的方式,快速的實現係統集成到視頻大係統。同時,SC1 板卡等產品也對外發售,客戶可根據官方 API 進行二次開發。”

全球首發 SOPHON TPU 芯片 BM1680、SOPHON SC1 和 SC1+板卡

SOPHON TPU 芯片 BM1680,麵向深度學習應用的張量計算加速處理的專用定製芯片,適用於 CNN、RNN、DNN 等深度神經網絡的推理預測(Inference)和訓練(Training)。

BM1680 單芯片能夠提供 2TFlops 單精度加速計算能力,芯片由 64 NPU 構成,特殊設計的 NPU 調度引擎(Scheduling Engine)可以提供強大的數據吞吐能力,將數據輸入到神經元核心(Neuron Processor Cores)。BM1680 采用改進型脈動陣列結構。片上 32MB SRAM 擁有高帶寬,在片外有 DDR4 內存接口,單芯片可支持高達 16GB DDR 內存。

通過高度定製的 BMDNN Chip link 芯片鏈路技術,在高速 SerDes 上提供穩定、靈活、低延遲的鏈路,可以使多個 BM1680 芯片一起工作,作為一個統一的係統,能夠提供更高的處理能力。

BM1680 芯片架構圖(摘自 BM1680 DATASHEET 文檔)

基於 BM1680 芯片,BITMAIN 提供 Sophon SC1 和 SC1+的板卡產品。其中 SC1 擁有一顆高性能的 BM1680 芯片,而 SC1+ 則是雙 BM1680 級聯架構,芯片之間通過高速 SerDes Chiplink 互聯,為深度學習計算帶來全新的加速體驗。

SC1 / SC1+ 板卡實物圖

SC1 和 SC1+的架構類似,都通過 PCIE 的總線連入係統。具備高達 2TFlops / 4TFlops 的單卡計算能力(單精度),單芯片 On Chip SRAM 高達 32MB,較大的 SRAM 適合裝載整個神經網絡模型。同時在板卡上搭載 16GB 或 32GB DDR4 內存,大容量存儲適合存儲較大的神經網絡模型。

板卡實物圖

SC1/SC1+規格參數一覽:

SOPHON 芯片和板卡的軟件接口和全棧軟件支持

SOPHON 擁有軟硬件全棧開發的能力,和各個層次的工具鏈能力,從硬件、驅動、指令集、線性代數加速核心數學庫,RUNTIME 庫,BM Deploy 的 Inference 部署工具,FFT 加速庫,深度學習框架(Caffe,Darknet, Tensorflow,MXNet 等)。真正實現了軟件、硬件的協同設計和一體化的優化,實現深度學習應用在硬件上的最佳優化性能。

SOPHON SS1 智能視頻分析服務器

智能視頻分析服務器 SOPHON SS1,是一款新的深度學習服務器。基於 BITMAIN 最新研發的 SOPHON SC1/SC1+深度學習加速卡和對於圖像識別算法的深度理解而打造的深度學習服務器,專門為視頻監控、互聯網圖像等多種應用場景提供強大的深度學習加速能力。

SOPHON SS1 提供了一整套針對視頻和圖像識別技術的深度學習解決方案。係統核心組件是兩張 SOPHON SC1(或 SC1+)深度學習加速卡,通過 PCIE 接口實現與應用係統的連接。SS1 的應用係統基於 X86 CPU 打造,以供啟動、存儲管理及深度學習 SDK 協調之用。SS1 的整個係統被濃縮進一個 4 機架單位(4U)機箱中,集電源、冷卻、網絡、多係統互聯及文件係統於一體,客戶可以在此基礎上實現快速的二次開發或係統集成,最大程度上方便了用戶對深度學習係統的利用。

SOPHON SS1 實物圖如下:

SS1 具備的幾大特點:

為應用場景而定製的 Turn Key 開箱即用的方案

高性能的異構計算優化,異構協同

首個為深度學習預測/推理而優化的軟硬件 CoDesign 方案

強大的工程和研發團隊支持

數據中心級別的硬件品質

向用戶開放全部的軟件源代碼

SS1 規格參數如下:

SOPHON 視頻分析 AI 應用展示

SOPHON SS1 服務器集成的人臉/人體檢測、機非人視頻結構化分析等等 DEMO,展示行業應用方案能力場景,落地 視頻分析安防行業方案。展示 人檢測,車檢測等等。BITMAIN 也將快速快速迭代的視頻結構化 API。

SOPHON 板卡和服務器,將在官網 SOPHON.AI 麵向全球發售

全球官網 SOPHON.AI 已經全麵發布,客戶可以了解最新的產品、方案信息。

板卡產品 SC1 規格和發售價:

服務器 SS1 規格和發售價:

另外,據官方介紹,在此次發布的第一代人工智能產品 BM1680 芯片,以及板卡、服務器等的基礎上,BITMAIN 還將保持創新和快速迭代,預期於下個月推出第二代芯片BM1682,2018 年9月份推出基於12nm FinFET 製程的第三代產品,加速人工智能時代的進程。

最後更新:2017-11-10 02:20:05

  上一篇:go 天業股份:量子通信+人工智能妖王覺醒,遭主力30億殺入
  下一篇:go 人工智能第一龍頭躁動,神秘機構百萬建倉,引領黑馬飆漲接力京東方A