【複盤】從肩挑背扛到99%聚石塔訂單,AliCloudDB四年雙11技術突破!
2015年天貓雙11購物狂歡節已經完美落下帷幕,高峰期間訂單創建每秒達到了14萬筆(達每秒14萬筆),總訂單量達到了4.78億,技術指標再次刷新世界紀錄。其中99%的訂單通過聚石塔訂單推送,並在阿裏雲雲數據庫服務(RDS)中完成存儲和處理。在持續高壓力衝擊下,整個雙11期間AliCloudDB表現堅如磐石:
AliCloudDB上穩定運行,全網實現了0故障,0丟單。
AliCloudDB是如何保障在零點洪峰來臨時候穩定、安全和順暢?如此龐大規模的數據庫實例集群又是怎樣一步步成長起來的?“雲棲社區”特別邀請連續4年支持天貓雙11的AliCloudDB團隊核心專家玄慚,深入分享這4年雙11背後的AliCloudDB是如何實現技術突破的。
圖:天貓雙11背後的“護航俠”——阿裏雲數據庫
2012,肩挑背扛和逐個優化
阿裏雲數據庫短短一個月內幫助用戶手工遷移了數百規模的數據庫實例到雲上。
阿裏雲數據庫團隊白天要準備資源和雙11所有工作,夜裏還需要協助用戶將數據庫遷移上雲。彈性升級需要對實例逐個進行升級,商家的數據庫也需要逐個進行優化,並為商家提出優化建議。天貓雙11能否扛過零點高峰?我的心裏是打鼓的,但結果讓我們深受鼓舞。完全OK。而後幾年,我們不斷打磨產品,沉澱出了眾多的產品需求:例如上雲遷移,資源自動擴容,收容和離散,性能診斷自動化等。在我們看來,隻有把雙11的經驗和能力產品化,才是真正長遠發展之計。
2013,指數增長和數據鏈路改造遷移
阿裏雲數據庫支撐雙11商家後台核心數據庫的第二年。其承擔了天貓50%的訂單量。如果用一個關鍵詞來形容2013年的雙11,那就是變化。第一年雙11實例規模量不是很大,然而2013年的雙11實例數規模則是成指數級別增長。原來的數據訪問鏈路層的容量已經不能再支持如此規模的用戶量。所以我們開始對數據鏈路訪問層進行改造遷移。改造遷移過程的時間點與雙11的備戰時間點重合,由此觸發了非常多的變化,給雙11的備戰工作造成了很大的壓力。一路拚搏,終於在雙11之前把鏈路架構穩定下來。雙11當天,記憶尤深的是下午6點左右出現的驚心動魄的場麵。由於一個用戶發送了超大長度的SQL到阿裏雲數據庫,同時由於Proxy本身問題,所以整個proxy集群出現異常。雖然問題很快得到了處理,影響可控,但給我們敲響了警鍾——2014年要重點把數據鏈路中間層穩定下來。這一年中,我們挑戰很大,經驗也得到很多:
2014,注入攔截保證安全和數據庫優化
阿裏雲數據庫在經曆了兩年的成長期之後開始迎來成熟。汲取了2013年數據鏈路改造的慘痛教訓,我們在雙11前統一了所有集群的數據鏈路訪問。在支持靈活數據鏈路訪問模式,高安全鏈路訪問模式下,實現了SQL注入的攔截功能,幫助用戶更簡單地防護數據庫的安全,避免數據庫被注入攻破。雙11當天表現平穩。承擔了天貓96%的訂單量。集群QPS峰值達到142W。集群RDS實例數也達到了曆史新高。
2015,資源自動離散與收容和自動化診斷
AliCloudDB在穩定性以及產品功能的豐富上不斷進步。未來,我們希望能夠出去多走一走,接近雲用戶,多多傾聽他們的聲音,將最佳實踐和保障經驗傳承給用戶,幫助他們一起把係統穩定性保障起來,是我們最大的心願。
任何數據庫技術問題,都找雲棲社區數據庫團隊,大牛都在這裏!
最後更新:2017-04-01 13:44:33