閱讀102 返回首頁    go 機器人


人工智能花開三朵,如何完整綻放?

文/鄭凱

如今,圍繞在人工智能領域有兩種極端的認知。一種看法認為,人工智能將無所不能,它會在未來建立新的人類社會規範;而另一種看法,則對人工智能非常抵觸,認為人工智能會毀掉人類的根基。

天使與魔鬼並存,這是不是人工智能最真實的寫照?其實都不是。

9月7日,AICC人工智能計算大會在北京召開,與業界所有有關人工智能的大會不同的是,這場會議多了“計算”兩個字,殊為關鍵。為什麼呢?

在雲計算和大數據之後,人工智能成為了當下最熱門的風口。最新數據顯示,目前中國已擁有592家人工智能公司,占全球總數的23%,僅2016年一年,中國在人工智能領域就有超過200億元的投資。

虛熱不斷的人工智能概念,卻總是忽略了技術本身。中國工程院院士、浪潮集團首席科學家王恩東說,“人工智能的發展、人工智能的支撐,離不開計算、算法和數據這三大屬性。尤其是計算,正是由於計算能力的快速發展,結合互聯網、物聯網帶來的海量數據和深度學習等先進算法,才共同催生了第三次人工智能浪潮。”

可見,計算、算法和數據三個維度的突破,有了人工智能綻放的可能。

市場環境為數據和算法打下基礎

前不久我國發布了《新一代人工智能發展規劃》,將人工智能正式上升為國家戰略,人工智能將在我國從“世界工廠”向“世界智能工廠”轉型中將起到重要作用。

這表示,政策環境對人工智能產業的支持正向更好的一麵發展。《新一代人工智能發展規劃》是7月20日公布了,其中明確提出了中國人工智能“三步走”戰略、八大關鍵技術研究、數十個產業落地、AI人才的培養和引進、以及成立人工智能規劃推進辦公室等戰略規劃。

可以說,這是中國人工智能產業發展的總體綱領,也為人工智能發展所需的技術環境打下了基礎。因為人工智能創新應用的發展離不開數據的開放和共享。從國際上看,開發、開放和共享政府數據已經成為普遍潮流,英美等發達國家已經在公共數據驅動人工智能方麵取得一定成效。而我國此前仍缺乏國家層麵的整體戰略設計與部署,政府數據開放仍處於起步階段。所以,有了國家政策的支持,數據的開放也會逐漸深入,這對人工智能在數據層麵的完整和健全會起到明顯的作用。

其次在算法層麵。因為互聯網公司的崛起,他們是最早一批布局人工智能的企業。所以,近年間,籠絡了大量機器學習的人才,同時又有互聯網業務的實踐,所以對算法層麵的進步起到了不小的作用。

可以說政策環境驅動了數據鏈條的完整,而市場環境驅動了算法的進步。那麼,計算力的發展要靠誰來推動呢?王恩東說,“盡管計算已經有了快速的發展,但麵對人工智能這樣一個蓬勃發展的需求,仍然麵臨著許多挑戰,排在第一位的仍然是計算性能。”正是為了計算不再成為人工智能的短板,AICC人工智能計算大會的意義就是讓數據、算法和計算達到融合,並做到助推人工智能產業升級的目的。

計算支撐優化組合,做到在AI時代勝出

實際上,我們會發現凡是在人工智能領域走得比較早的企業,他們所建立起來的優勢很難被撼動。這些公司大部分是互聯網公司,首先互聯網公司更早的看到了數據的價值,所以他們的數據鏈條相對完善;其次,互聯網公司切入人工智能更早,所以學習的算法以及成果更出色,後來者想要追趕這些公司的步伐,即便有了同樣的數據,也需要很長時間的深度學習來達到先行者今天的水平。

這難道就是一個無解的難題嗎?

高效能服務器與存儲技術國家重點實驗室科學家、浪潮集團副總裁胡雷鈞告訴我,“大家所說的人工智能三要素,數據,模型算法,和計算能力。誰能夠把這三個組成一個性價比最優的組合,誰就能勝出。”

比如,如果數據少,但模型算法更好,就意味著層次更多、節點更多,精度更高。那麼,模型越大,就需要計算能力更強。而好的模型和更強的計算能力的組合,有可能彌補在數據上的不足。可見,計算力的提升實際上,給予人工智能公司很大的想象空間。

而對於算法的發展,胡雷鈞也寄予很高的期待,“計算能力和數據實際上是需要錢的,是需要大投資的,還需要實踐的積累和投資的積累,反而在計算模型上的投入,有可能在有限投資的情況下獲得更大的收益,獲得更大的平衡。”

這意味什麼?算法模型上的巨大突破,也會彌補計算力的不足。所以,人工智能領域裏的機器學習,現在的算法,以及計算的發展會互相推動,再進行進一步的組合,實現如今不能想象的未來。“如果說,今天的人工智能公司,投入的早積累的多,就有優勢,可是以後就未必。”

過去,業界對人工智能的關注,過於局限在算法和數據兩個方麵,而我們經過這些這些理論和實踐會發現,計算對於人工智能發展的重要程度,正在日益凸顯。

打破AI計算的瓶頸,建立體係化的生態係統

這幾年來,人工智能的技術雖然走很快,但是卻比較零散,並沒有一個公認的技術體係。胡雷鈞認為,“人工智能要想繼續往前發展,就必須體係化、層次化的構建它的生態係統。有一個相對完整的生態係統的支撐,我們才能推動計算係統能夠麵向應用需求。在具體的實踐中,我們認為AI的計算平台、AI的係統管理、AI的計算框架、AI的應用方案作為一個生態係統裏不可或缺的幾個重要環節,在滾動推動著AI的發展。”

隨著更多的人工智能應用出現,AI計算平台也會遇到很多瓶頸,比如數據的瓶頸、計算能力的瓶頸、延遲的瓶頸、通信能力的瓶頸等等。這裏有三個核心的問題:第一處理單元能多快速度的取到它處理的數據,第二每次處理之後能以多快的速度去交換數據,這是通訊問題。第三在單位的空間內能集成多少計算能力。胡雷鈞說,“這是約束著一個計算係統最大規模也是約束著我們能以多快的時間完成一個模型的訓練的問題。”

所以,在這些需求之上,浪潮構建了自己的人工智能價值體係。

首先是基於計算平台的創新:由於提高單位空間之內的計算能力和計算單元之間交互數據的能力,浪潮在2U空間內能集成8個,甚至以後可能更多的GPU處理器,以獲得最高的計算能力。浪潮還通過服務器與GPU BOX的分離,擁有了更靈活的計算組合,以便適應各種不同的神經網絡的模型。

其次,在管理平台上,浪潮在思考如何把雲計算的技術、雲計算調動大規模運算的技術應用到AI計算上來,為AI開發者和運維者麵臨的各種巨量的運算應用提供一個管理模式,所以浪潮提供了一個計算框架的分析工具,通過這個分析工具可以細微地看一個具體的神經網絡的模型在某一個計算平台裏的運算表現,或是係統瓶頸。

第三,是人工智能的框架,浪潮做了Caffe-MPI。浪潮是首個把Caffe的計算模型從原先的單機版擴展成為集群版,通過這個集群版可以做到在一個係統裏運行更大尺寸的神經網絡,同時通過MPI的編程能夠更有效的調動係統的資源來完成一個高性能計算。

胡雷鈞說,“這實際上就是把我們在高性能計算領域裏的應用模式和應用方法移植到了AI的平台上,通過我們原先已經有的在大規模計算平台上的經驗,提高AI應用或者說提高神經網絡的訓練效率。”值得一體的是,Caffe-MPI目前還是一個由浪潮貢獻的開源項目。

第四,麵向AI的應用,浪潮提供了E2E的解決方案。一整套的方案當中,浪潮有高密度高性能的模型訓練的平台AGX-2,它是目前世界上最高密度的AI計算平台,在2U空間之內支持NVLink,支持P100GPU,有基於FPGA的F10A加速卡,有高效的人工智能管理平台AIStation,有高性能深度學習框架Caffe-MPI,同時浪潮還有非常有經驗的工程師隊伍可以幫助優化算法。

基於這些不同層麵的投入,浪潮打造了一個麵向AI的生態,如胡雷鈞所說,“浪潮希望在產業基礎的推動下往前滾動發展,未來一定能更好的支持我們的AI應用,無論是訓練、學習、現在的監督式學習還是正在發展的自主學習、未來終極目標類腦的學習,都會以非常好的基礎來支撐我們。”

在我看來,AICC人工智能計算大會的意義是重新定義了,計算在人工智能價值體係中的定位,以計算作為支撐,實現計算、數據和算法三者的優化組合,並相互促進,最終開出的才是人工智能最美的花朵。

最後更新:2017-09-10 20:37:56

  上一篇:go 讀圖後時代,人工智能能否破解圖片社交困局?
  下一篇:go 讀圖後時代,人工智能能否破解圖片社交困局