閱讀416 返回首頁    go 阿裏雲 go 技術社區[雲棲]


一邊哭泣一邊寫代碼,是種什麼感受?

《盡在雙11:阿裏巴巴技術演進與超越》一書發布後,得到了眾多開發者的支持和厚愛。剛交付首批書後的第三天,印刷廠就連夜開動機器,緊急加印。因為沒到兩天,書就賣斷貨了!

《盡在雙11:阿裏巴巴技術演進與超越》
精 彩 引 言(by霜波)


image

不知不覺中雙11已經走過了八年,從剛開始的全新概念,到現在的舉世關注,有偶然也有幸運的成分,但是細細數下來,每一步,每一刻,都是好多人殫精竭慮、費盡心思的結果。對技術而言,每一年的雙11都是一場嚴峻的考驗,從被流量衝擊得潰不成軍,被迫奮起抗擊,到現在通過技術的力量不斷改寫雙11的用戶體驗和參與感,阿裏的技術伴隨著雙11成長起來,強壯起來,自信起來。

image
雙11技術團部大隊長霜波

從組織上來說,雙11從第一年的突發奇想,野生無序,逐漸發展下來,已經成為一場整個阿裏及其生態聯動的戰役,雙11已經不僅僅是天貓的雙11,也不僅僅是阿裏所有事業單位的雙11,而是整個互聯網生態的雙11。

2009年我們技術部門隻有幾個人臨時安排值班,高峰每秒隻有400個請求,到2016年阿裏有23個事業單位、幾千位技術人員一起加入了雙11的備戰。杭州西溪園區1號樓的7樓、6樓和5樓都成為了雙11的集中作戰室,實現了每秒處理1.7萬條請求的技術奇跡。為雙11做出艱苦備戰的還有商家、銀行、物流公司,他們和我們一起迎接流量高峰的挑戰,一起為了互聯網更加完善的用戶體驗不斷努力和前進。

麵對新的挑戰,我們從不敢放下的是對用戶的敬畏和感激之心,借由此書,借由雙11的曆史,將阿裏這些年在大流量管控上所做的技術創新共享給關注我們的朋友,並答謝所有雙11的貢獻者、參與者、傳播者、提及者和知曉者。




2009年是淘寶商城(淘寶商城:2008年4月成立,是一個高品質商品的綜合性購物網站。2012年1月11日上午,淘寶商城正式宣布更名為“天貓”。)成立的第二年,這一年的秋天,運營部門想搞一場營銷活動,逍遙子(逍遙子:現任阿裏巴巴集團首席執行官,同時是阿裏巴巴集團董事局董事。2008年逍遙子是淘寶網首席運營官兼淘寶商城總經理。)喜歡四個一,而11.11又是網民創造的“光棍節”,所以就選擇了這一天。

誰也沒有想到,這樣一個帶著點隨意的選擇,竟然在若幹年後成為影響中國乃至全球的大事件,造就了電商行業最具影響力的品牌——雙11。

第一屆雙11的活動口號是全場五折,拉了幾十個商戶參加,未曾想效果驚人,淘寶商城的成交額是平時的10倍。幸運的是,在2009年年初,五彩石項目將淘寶網和淘寶商城的係統底層架構統一了。雖然淘寶商城的成交額增加10倍,但由於基數還比較小,這個成交額和淘寶網的日常成交額比起來並不大,因此係統上雖然出現一些小問題,但是沒有產生特別大的影響。

盡管如此,暴增的流量還是讓工程師們措手不及。采訪當年第一屆雙11的工程師四虎(四虎:2007年加入阿裏,參加第一屆雙11的開發,連續參與雙11八年,現在是聚劃算技術負責人。)時,他回憶說:“第一年雙11,作為交易係統的owner(所有者),接到老板指示,光棍節要搞個活動,你值一下班。那年我們啥都沒做,就坐在那看服務器的情況。零點一到,發現服務器流量暴增,一下子部分應用的服務器就掛了。我們就手忙腳亂地去重啟服務器,恢複係統。應用係統起來後,發現店鋪和商品圖片又出不來了。

第一次雙11,可以說完全是意料之外,沒有做任何準備的,不僅把我們的交易和商品係統壓掛了,同時還把很多商家的外部圖片空間也給壓掛了。服務器容量、網絡帶寬容量、係統保護都是沒有的。”




吸取了上一年的經驗,2010年雙11之前,技術部門專門成立了大促小分隊,隊員包括各個核心係統的開發人員和技術保障部軟硬件維護人員,當時還成立了大促指揮團,由振飛(現任阿裏首席風險官。2010年任技術保障部副總裁。)、周明(現任基礎架構事業群資 深 總監。2010年任技術保障部總監。)、範禹(現任天貓事業部技術部資深總監和研究員。)統一負責大促技術方案的相關決策。

負責保障穩定性的人員在指定地點集中辦公。那一年,高峰不在零點,而是出現在第二天白天,早上10點左右,CDN的容量很快達到上限,圖片展示越來越慢,眼看就要出不來了。大家緊張起來,激烈地討論還有什麼辦法。

有人提出搜索的圖片展示占了很大的容量,可以將搜索的大圖降級為小圖。然後給搜索的負責人打電話,通知他:“對不起了,我們要對搜索的圖片降級了,雙11結束就給你們恢複過來。”這一招幫助當年的雙11渡過了容量的最大風險。

之後,每一年的搜索大圖降級為小圖都成了雙11的必備降級方法之一,盡管後麵再也沒有啟用過。同時,每一年雙11之前CDN都會開一個大會,讓所有業務評估自己雙11當天的CDN使用量,提前兩個月就開始做擴容的準備。“所有的苦難都是用來幫助我們成長的”,這句話用在雙11上特別合適。

四虎回憶第二年的情景:“第二年,我們開始有了心理準備,預計流量是平時的3~5倍,但是實際流量遠遠超出我們的想象,達到了平時流量的十幾倍。不過基於前一年的經驗,這一年我們做了很多工作,分布式係統的防雪崩、核心係統的自治,這些技術改進讓我們的係統比上一年好了很多,雖然零點高峰時還是出現了大量的購買失敗,但是服務器沒有大麵積宕機,流量下降後能夠繼續良好地服務。”




從2010年開始,為了雙11的順利進行,阿裏每年都會任命一個雙11技術部團長來整體負責雙11技術的穩定性工作。在團長之下,會成立一個大促小分隊,然後在各個事業群選拔最合適的同學作為各個事業群的隊長。

隊長在負責本BU技術工作的同時,還負責和其他BU進行聯動和消息共享溝通。隊長通過周會的形式來互報進度和風險。為了雙11當天的穩定,每年都會安排4至6次的功能回歸演習和全鏈路壓測驗證工作,這些工作會在幾十個事業群中同步進行。通常參加一次全鏈路壓測的技術人員都會在300人以上。

image

這麼多年雙11下來,有些人好奇:“做了這麼多年了,該準備的都準備好了,為什麼每次技術部還那麼緊張啊?”聽完了這些曆史,也許能有一絲明白,每年的雙11,我們的玩法都在變化,我們的流量不斷挑戰高峰,我們的技術也在效率和創新上實現著自我突破。

雙11沒有一年不辛苦,沒有一年不緊張,沒有一年不需要加班熬夜通宵,沒有一年不是戰戰兢兢。有人在解決問題時一邊哭泣一邊寫代碼;有人在雙11結束的第二天就會去找主管“我明年再也不要幹雙11了”;有人由於身體或者家庭的原因申請離開。

但慶幸的是,每年都會有更多的人加入進來,帶著新的熱情和夢想,明知路難行,明知山有虎,但總需要有那樣一群人,咬著牙,紅著眼,在再大的壓力下,在再苦的環境下,在已經通宵神誌不清的情況下,把問題一個個解決掉,然後笑著告訴大家:“今年我們一起又把雙11扛過去了。”

image

這是我們阿裏技術對所有用戶的態度,我們不完美,我們會犯錯,我們沒有提供給用戶最好的體驗,我們很抱歉,我們會在深夜哭泣,哭泣我們不小心的遺憾,哭泣我們一個疏忽給用戶帶來的嚴重影響。

但是我們在努力,我們在前進,我們在錯誤中不斷反思,繼而成長。感謝這些年用戶對我們的接納和信任,請相信我們在努力。也借這本書答謝所有參加過雙11的朋友們,謝謝你們對我們的信任,我們會帶著這份信任一路前行,讓中國互聯網的聲音響徹全世界。




細心的童鞋或許已經發現了,這篇序文為何缺少了“2011—2016年”雙11的回顧。

事實上,從2011年的“匆忙中解決突發事件”到2015年“移動端購買率大大提升”,再到去年實現雲化,一路誕生了無數精彩的故事和技術突破,這一切你都能在《盡在雙11》書裏感受到。

原文鏈接

最後更新:2017-06-19 12:01:59

  上一篇:go  (原創)開發者論壇移動版全新上線,小談感受
  下一篇:go  流著碼農的血,為突破理論極限值而生 | 阿裏中間件性能挑戰賽內部賽全記錄