何雲飛:雙11計算的本質是脈衝計算
本文作者為:雲棲社區特約記者林易
“在從計算機誕生到90年代,計算資源都是作為“可計劃性”的資源來使用的。”
在阿裏雲資深專家何雲飛看來,傳統IT行業的整個鏈條,都圍繞著這樣的資源調度來實現的。
無論是探索月球,還是計算天體運動,計算資源本身是可規劃的。
一個典型的例子,就是阿波羅計劃。
這是人類第一個大規模使用計算機的場景,雖然計算量複雜,但什麼時候上天。
什麼時候計算軌道,軌交雷達什麼時候返回數據,都是可預測的。
然而,隨著互聯網時代的到來,越來越多的應用場景,讓計算資源變成了“脈衝式”的使用。
一個爆發的事件,就有可能考驗你的整個計算資源。
“所謂的脈衝計算,就是指在一個確定的時間內發生的海量信息事件,且必須在這個確定的極短時間內處理完的計算事件。”何雲飛認為,這樣的事件在互聯網時代會變得越來越普遍。
而雙11就是這樣的一個典型場景。

何雲飛有一個觀點,“其實我們在比較早的時候,就發現了傳統IT與脈衝計算並不那麼match。”
在我們的傳統IT架構中,擴展是向上拓展的,我們最常見到的就是小型計算機,
但是,小型計算機所有的硬件資源都是特定的,備貨周期長,維護成本高,波峰使用以後閑置的情況比較多。
最簡單的總結,就是傳統IT的彈性不夠。
工程師們把眼光瞄準了當時市場上通用的x86服務器,希望通過x86服務器,來挑戰傳統的小機。
通過遍布全球的數據中心,以及大規模的分布式調度係統,分布式文件係統,分布式計算係統,來整合計算能力,實現資源的彈性利用。
通用的x86服務器,可以通過很多渠道快速部署,而在脈衝結束以後,又可以迅速的被碎片化的切刀其他應用場景中去。
“這就是阿裏雲最早做雲計算的理念,飛天就是從這裏開始的。”何雲飛說。
2012年,飛天在2011年商業化以後,第一次麵對雙11,彼時雙11還不像今天這樣令人矚目。
隨著訂單的海量化,在雙11中,一個突出的問題出現了:商家自己的訂單係統與阿裏係統同步的問題。
過去的處理方法很簡單,阿裏把API開放給商家,商家通過一定的安全驗證以後,使用自己開發的軟件來讀取這個接口的數據。
“這樣海量的數據訪問,受到架構限製是很明顯的。”在何雲飛眼中,這是個典型的脈衝事件中的脈衝事件。
“當時就想,那麼能不能把“飛天”的彈性計算能力,開放給商家,讓商家在一個穩定的數據環境中工作。”這就是聚石塔的緣起。
2012年7月10日,天貓與阿裏雲、萬網宣布聯合推出聚石塔平台,率先以雲計算為“塔基”,為天貓、淘寶平台上的電商及電商服務商提供IT基礎設施和數據雲服務。
通過阿裏雲的ECS雲服務器,RDS雲數據庫,SLB負載均衡網絡,雙11的商家訂單,直接源源不斷的推送到了商家平台上,保障了數據的穩定和延續。
“那年雙11,我們無一漏單,錯單。”何雲飛很高興的講述了飛天與雙11的第一次相遇。
而2013年發生的挑戰,則與一個火熱的產品有關:餘額寶。
2013年7月,餘額寶決定上雲,上雲並非一句話那麼簡單,使用雲計算支撐當時國內最大的基金直銷和清算係統,前無古人,但開弓沒有回頭箭。
而短短4個月以後,雙11就來了。
對於阿裏雲來說,雙11期間餘額寶巨額資金流入流出,已經是極大的考驗了。
“但是,你別忘了,餘額寶,最大的特點是,資金是有利息的。”何雲飛說。
而餘額寶的利息,必須在第二天早上6點完成計算,這是雷打不動的。
ODPS(現在稱為Maxcompute)在這個過程中發揮出了性能優勢,在短短6小時中,ODPS完成了這個複雜的計算。
12日淩晨6點悄然而至,早起的用戶發現,餘額寶用戶賬戶裏的資金都更新了。
也就是從這一年,阿裏雲金融雲聚寶盆對外服務,雙11的雲服務能力,開始助力金融行業。
2014年的雙11,在何雲飛看來,經過多年的演進,阿裏雲對於脈衝計算的應對能力,開始變得完善起來:金融雲的係統支撐能力達到了2013年的3倍以上,可支撐十億筆以上的超大日支付處理能力。
而更重要的是,這一年雙11前夕,阿裏雲聯合阿裏集團電商平台一起攻克了另外兩項世界級的創新難題--“服務器資源彈性部署”和“數據中心異地雙活”。服務器資源彈性部署,可以應對不可預知的業務爆發。
“一旦有超出預期的業務熱點出現,係統可自動調用其他資源使用不足的服務器,實現"分鍾級無縫切換",在不增加硬件部署的情況下應對更複雜的流量變化。”這是阿裏雲已經能夠完善的應對脈衝計算的標誌性事件。
而脈衝計算的另外一個特征是,無法從頭再來,必須保持最高標準的可靠性,“數據中心異地雙活”,則可以幫助阿裏巴巴應對極端的自然災害,即使杭州的數據中心“掛掉”,雙11仍然能夠順利運轉。
這項技術可實現跨省的兩地數據中心像一個數據中心一樣工作,同時支持雙11 的所有應用。
“兩地數據中心的切換,能在不中斷業務的情況下完成,這就像為正在飛行的飛機更換引擎,不僅不影響飛行,飛機上的乘客也不會有感覺。”何雲飛談到。
“2015年,基於公共雲的“飛天”平台成了雙11最重要的核心設施,這意味著阿裏雲已經能夠為脈衝計算提供最可靠的解決方案了。”這是何雲飛對2015年雙11的解讀。
2015年,雙11淘寶天貓核心交易鏈條和支付寶核心支付鏈條的部分流量,直接切換到阿裏雲的公共雲計算平台上。通過將公共雲和專有雲無縫連接的模式,全麵支撐雙11。
因此,如果從技術層麵來看,2015年雙11成為了一場全球最大規模的混合雲彈性架構實踐。而阿裏巴巴也成為全球大型互聯網公司中,首個將核心交易係統放在雲上的企業。
與此印證的是,阿裏雲成為全球第一家有能力支撐核心交易係統的雲服務商。
“這一混合雲架構完全基於阿裏雲官網在售的標準化產品搭建的。也就是說,你通過這些標準化的產品,也可以搭建這樣一個像淘寶、天貓這樣萬億級的企業應用,滿足任何極端的業務挑戰。”阿裏雲總裁胡曉明曾經在一篇報道中這樣評價。
2016年阿裏視頻雲支撐起了千萬級的直播,同時觀看到達4000萬人以上,通過阿裏雲的600多個CDN節點,歡樂到達了全球。
而八分鍾新建一萬台計算資源的能力,相當於能交付一個中型互聯網公司的彈性資源,這才是阿裏雲應對海量峰值的底氣。
而基於阿裏雲和菜鳥物流聯合開發的物流雲,提高了物流係統的流轉效率:雙11第一單在13分鍾內送到了用戶手中。
而飛天的對象存儲係統OSS,承擔了所有的圖片及小文件存儲的重任,讓消費者得以在一秒鍾內,就可以打開自己心儀商品的圖片。
聚石塔一如既往的無漏單錯單。
而“飛天”支撐起了人工智能ET,讓買買買更智能,更懂未來。
2016年的雙11對今天的阿裏雲來說,具有著節點意味:在此前的中國,沒有一家雲計算廠商能夠與合夥夥伴攜手建成一個如此完整的PAAS解決方案,並且能對外輸出,而“飛天”已經不僅僅是保障天貓雙11的鏈條,而是整個“雙11”的真正基礎設施。
11月12日的零點鍾聲響起,數字定格在千億之上。
然而,重要的不僅僅是這個數字。
“這意味著,阿裏雲已經能夠隨時為社會輸出雙11的計算能力。”何雲飛認為,阿裏雲能夠應對社會在任何時候,任何領域對於脈衝計算的需求。
這樣的需求,不僅僅在雙11中,也在春運火車票回家的腳步中,高並發的購票需求得以平穩應對。
在春節的紅包狂歡中,金融雲支撐起了紅包的快樂,還在今日頭條,微博突發的新聞事件中:信息得以飛速的流動,並讓每一個人都平等獲得。更在台風來臨之際的預測中,保障著城市的安全。
“脈衝計算,已經是人類社會計算的‘新常態’,更是人類探索未知的‘核武器’。”何雲飛認真的說。
最後更新:2017-07-19 09:32:44