閱讀152 返回首頁    go 阿裏雲 go 技術社區[雲棲]


雞蛋究竟宜不宜生吃——看阿裏雲計算怎麼破?

9月12日虛擬化平台新產品的媒體溝通會上,不少記者對雞蛋演示的demo很感興趣也有一些疑惑。看看來自小白不菜的精彩分享吧。

雞蛋究竟宜不宜生吃——看阿裏雲計算怎麼破?
1

   姐告訴你,算!雞蛋裏有一種物質,生吃會導致人早生華發,往小了說影響泡妞撩妹,甚至終身大事,往大了說,那可能會導致你光頭謝頂,疾病纏身!

因為生雞蛋清中含有一種抗生物素,叫“親和素”,是一種蛋白質,會防礙人體對雞蛋黃等食物中所含的“生物素”的吸收。這個生物素非常重要,在脂肪合成、糖質新生等生化反應途徑中扮演重要角色。如果你缺少生物素,就會導致毛發脫落、體重減輕、皮炎等疾病。

(所以雞蛋一定不能生吃——要熟了後,才可以殺死雞蛋內外的細菌,又能破壞親和素,且禽流感病毒NH的滅活溫度是100度沸水,必須煮沸!!!)

其實最早是一位德國科學家曾做過這類研究,采用了一種分子動力學模擬的方法來確定,看兩種有機分子之間有多大的結合力,教授們試圖用一種極其複雜的數學模型來驗證非關聯性因素——用阿裏雲高性能計算資深專家何萬青的話說,由於分子動力學計算都是典型的高性能並行計算,還需要不斷調整裏麵的各種參數,運算量非常大,這事必須用超級計算機才能算出來!

如果是過去,教授要麼自己構建一個超級計算機,但涉及購買、安裝、運維和軟件授權;要麼租用超級計算機,那也要排隊、租賃、發送請求、等待結果,還要考慮不同超算中心的不同軟硬件環境……總之是很繁瑣的事情。

事實是,非常巧合,阿裏雲的何萬青博士認識一位生物學教授,對親和素和生物素的結合很有研究,何萬青就用阿裏雲最新的E-HPC機群試用了一把。
2
用分子動力學模擬不同分子間的結合情況(你看懂了麼,沒關係,反正我也沒看懂。)

“結果是,教授在星巴克喝著咖啡就把這事兒幹了。”何萬青透露,隻需要筆記本,在下拉式菜單中選擇自己要的配置,阿裏雲就可以生成一個雲上的超算集群。

一般情況下,教授會用手邊的工作站做這個計算,但現在已經可以輕鬆登入阿裏雲用8個節點的並行集群環境,且還用阿裏雲上連通的可視化軟件來做實時渲染。教授的數學模型跑一個參數的實驗,就用了不到十秒鍾——把整個實驗的所有因素都排查一遍,一整天也差不多夠了。

當然,本著科學嚴謹的精神,楊姐必須指出的是,生雞蛋中的親和素會和體內的生物素強力結合形成晶體,從而造成生物素大量損失導致黑發變白的事,需要你每天大量吃生雞蛋,比如每天吃一打兒堅持幾個月,才會發生。偶爾嚐嚐鮮,隻要注意衛生,還是可以的。

其實教授的這個事情隻是中國人工智能領域遭遇困境的例子之一。現在有很多創業公司想做的事都需要高性能計算的支持:例如汽車碰撞模擬實驗,再例如人臉識別……
人工智能最大障礙:計算力

在人工智能(AI)大紅大紫的今天,一般人都能列出人工智能的三要素:算法、計算力和大數據。

其實人工智能是一個六七十年前就提出的概念,經曆過數十年中無數科研人員的推進,目前已經發展出了深度學習、神經網絡等等具體的應用門類。它們中的任何一個概念,提出也至少有超過30年的曆史,許多算法已經在實踐中趨於成熟。

而自從互聯網誕生到現在的區區數十年中,人類已經積累了數十ZB的數據。楊姐在這裏幫著換算一下,1ZB等於1萬億GB,而我們現在主流的筆記本電腦的存儲,大概是512GB的SSD。

也就是說,人工智能的發展幾十年來受製約的重要因素,就是計算力跟不上(其中包括存儲能力),這在個人電腦時代這幾乎是不可能完成的任務,隻有雲才能解決,而且,不是普通的雲!

阿裏雲異構計算負責人張獻濤對此體會至深,這也是阿裏雲為什麼在此刻推出全新的異構計算平台的原因。

科普一下,什麼是異構平台。所謂異構平台,就是基於不同的運算單元搭建的計算平台:最早的運算單元,也就是我們熟悉的CPU。CPU發展到今天,性能已經到了某種上限,已經不能單靠增加核心數來增加計算能力了。

就好比家裏的汽車,如果單靠增加汽油發動機的排量來增加馬力,那麼汙染問題就無法承受,所以,現在流行混合動力,許多車上裝了一部汽油機、一部電動機,高速時靠汽油機,低速時靠電動機,特殊情況時雙機一起發力。

所以,人類開始有了GPU,也就是圖形運算單元。它最開始研發的目的,是為了讓電腦有更好的圖形效果,與CPU不同,它的架構是單核計算能力弱,但核心數多,適合高並發運算的工作,很多時候,它和CPU協同運算的效率更高。

但這還不夠,因為人工智能需要同時開很多“車”!所以,必須引入新的一種能力“FPGA”!

如果說CPU、GPU是一塊出廠時就刻好了字的金屬板,阿裏雲新部署的FPGA就好比一塊黑板,可以無限次的擦寫、重寫,每次擦寫後都可以寫入一套新的邏輯,相當於產生了一塊新的芯片,這是依靠它內部的內部靜態存儲單元加載編程數據來實現的。

以前,人們用FPGA解決設計實驗環節中的問題,現在,發現它特別適合特定場景,如深度學習、物聯網、基因分析等某個特定硬件環節的加速。

所以,阿裏雲最近幹了一件事,搞了一個最新一代的異構平台,其最大特點,就是囊括了目前所有主流計算平台上的所有運算單元,包括AMD、英偉達提供的GPU,以及英特爾和賽靈思的FPGA……

恕姐不在這裏羅列複雜的芯片編號。姐猜,阿裏雲這樣的做法,是希望能夠覆蓋異構計算的所有主要場景需求,說的再直接一些,就是想包打天下。

可市場有這樣的需求麼?

人工智能當然是一個需求,蘋果的SIRI就是一個簡單而明確的人工智能需求案例,在語音問答的背後,藏著語音識別、語義理解、深度學習等諸多方麵的人工智能,它就是靠雲端提供的計算能力來完成的。

而非常多的創新就是在某個微觀領域進行人工智能的突破,比如一塊可以監測你血糖的口香糖,又或者一個可以分析你家裏霧霾狀況的傳感器。

**全麵布局AI**

如果你認同未來將是人工智能向各個領域滲透的“未來”,那麼阿裏雲今天的部署就沒有錯:FPGA更適合非標數據位寬的深度學習、金融分析、基因匹配、物聯網數據庫等領域。
3

其實,阿裏雲推出了基於英特爾FPGA的F1實例,英特爾呢,不是在今年以167億美元收購了FPGA雙雄之一Altera嗎,當時英特爾瞄準的是物聯網;但隨著目標應用場景的不斷豐富,阿裏雲也擴展到了基於賽靈思的F2。
4

其中,GA1適用於圖形圖像渲染,在這方麵能降低50%成本;GN5呢則被阿裏雲譽為“為計算而生”,計算能力是上一代的近100倍;還有就是GN5i可以匹配在線推理場景,可以讓人工智能的在線服務成本降低50%。

如果按以往的模式看,比如楊姐要搞一個企業,需要建立一個處理能力非常大的超級計算機群,那我就得按我需要的最大能力來購買,比如我的最大需求是5000個核,那我就要付出一筆天文數字的硬件費用,和更是天文數字的軟件及維護費用。

但在很多情況下,我是用不到5000個核,在旺季與淡季,在不同的需求變化的周期裏,我會浪費大量的計算能力——有一篇報道曾經寫到,許多地方花巨資建立的超算中心,很多時候都在閑置,這就是一個最大需求和一般需求的矛盾。

但是,有很多時候,企業又會遇到計算能力超過自有計算集群上限的時候,比如說,在暴風雨到來的時候,需要做大量微型雲圖的計算;在地震後,需要完成深層地質構造的大量斷麵分析;在發生戰爭的時候,模擬武器實驗效果的需求會激增……那按傳統的辦法是,繼續購買硬件,直到滿足需求。

其實,租用超算更加劃算。

所以,這也就是為什麼何萬青認為,E-HPC的最大價值並不在於頂峰的計算能力有多大,而是勝在靈活性,企業可以按照包月包年或者按需計費的方式,來快速獲得高性能計算集群能力,高性能計算調度能力和軟件能力,按需組建自己的“雲上超算中心”——和太湖之光這樣的頂級超級計算機相比,如果前者是珠穆朗瑪峰,E-HPC就是青藏高原,大概海拔4000多米。就像中國教授做的那個雞蛋能不能生吃的推理模型,就屬於這個係列,還可以按小時租。

當然,這種“租合適還是買合適”的問題,因需求而異。而對於那些更多有雲計算需求,但沒有算法和研發能力的公司,阿裏雲更願意直接“分享技術”,提供全方位的人工智能產業服務,包括智能語音交互、圖像/視頻識別、交通預測、情感分析等技術服務,這些技術正通過阿裏雲ET對外服務。

過去一年裏阿裏雲推出ET城市大腦、ET工業大腦、ET醫療大腦、ET環境大腦等行業垂直的人工智能係統,在城市治理、醫學診斷和工業生產方麵,諸多大型企業逐步將核心業務轉至雲上。

而這一點,也是未來競爭最為激烈的。

硬件服務雖然看起來很賺錢,但隨著硬件產能的提升,利潤總是在不斷的攤薄,而軟件和服務的價格,才有更大的彈性空間。

而寫到這裏,大家也都看到了,在穀歌、微軟都深耕自研芯片的大浪潮下,不排除阿裏將在芯片方麵有大動作……
來自小白不菜的精彩分享。

最後更新:2017-09-19 17:03:20

  上一篇:go  異構計算與高性能計算,是打開未來的兩把鑰匙
  下一篇:go  搬家請求