阿裏雲自研雲數據庫POLARDB,未來企業的數字化答案
在2017年的杭州雲棲大會上,阿裏雲總裁胡曉明做了題為“智能計算,為未來而生”的主題演講,在眾多內容中,阿裏雲的自研數據庫產品POLARDB,引發了廣泛關注。
從上個世紀60年代誕生開始,數據庫就永久的改變了人類對數據的管理和認知,陸續出現今日的DB2 、Oracle、Informix、MySQL等大玩家,現在,從登錄淘寶購物到在社交網站上高談闊論,背後都離不開數據庫的支撐。
數據庫,無處不在。
假如要詳細的說清楚阿裏雲為什麼要選擇自研數據庫這條路,大概可以從以下三個方麵展開。
數據庫已經處於不得不變革的時代
中國數據庫第一次規模爆發是在電信行業,1995年,為了解決計費計量等問題,中國開啟了第一次大規模的數據庫建設。然而在中國數據庫長達40多年曆史中,自研數據庫主要集中於政府,軍工等國計民生領域,屬於專用型的數據庫,然而麵對企業自用的高性能性通用型數據庫,仍處於空白。
公元2017年9月21日,阿裏雲發布了全新一代雲數據庫產品POLARDB,這是首個國產的通用高性能自研數據庫,在高性能通用數據庫這塊高地上,第一次有了中國麵孔。此前這一塊一直被國外廠商所獨占。
曆史開始著悄然變革,在海量數據膨脹的今天,金融、零售、物流等行業對於變革的渴望,間接對數據庫技術提出了更高的要求。那在中國眾多的互聯網企業中,為何阿裏雲能夠率先推出國產的通用高性能自研數據庫?
時間回到2011年,以阿裏巴巴為代表的互聯網企業帶動了中國各行各業開始“互聯網+”,傳統IT技術已經不能很好地滿足“互聯網+”之後的IT需求,例如:傳統銀行IT係統的設計基礎是銀行的網點數量、服務窗口數量,基於它就能計算一天銀行總交易筆數是多少,因為來選擇相應的IT基礎設施,對這種穩定態的IT需求,傳統的IT技術是最佳平台。
但在互聯網時代,大促及活動,每一個互聯網大型平台的波動,都會讓交易量變得無法預測,以雲計算為代表的互聯網技術架構成為支持這種業務形態的最佳平台。
而更多的獨角獸企業的湧現,再次挑戰了傳統的數據庫架構。
再次回到傳統數據庫的最大應用場景:金融領域,最近餘額寶的交易金額突破了萬億規模,成為了全球最大的貨幣基金,從2013年上線,業務在短短半個月增長了14倍,對底層技術架構帶來了巨大的挑戰,一方麵每天晚上清算的時間從最初的半小時、變成後麵的1小時、2小時、4小時……最後需要通宵達旦才能解決問題。
如果以傳統IT的視角來看這樣的擴容價格也是千萬級別的,費用超過了天弘基金曆年IT費用的總和。
如果把這個故事放到整個中國,未來中國企業將遭遇一場數據庫的成本危機,在中國的互聯網企業中,數據庫成本在IT設施中占比已經高達20%~40%,更重要的是,“棱鏡門”以後,越來越多的意識到,數據庫的安全並非可以用高價進行購買,國家利益永遠高於一切。
充分榨幹硬件紅利突破性能瓶頸
阿裏雲全新發布的雲數據庫產品POLARDB首次采用第三代分布式共享存儲架構,通過高速網路連接數據庫計算節點和存儲節點,引擎特別為高速網絡以及共享存儲架構重新設計,使POLARDB實現了即時生效的可擴展能力和運維能力。
我們來看一組數據,100%兼容MySQL 5.6、100T級別容量無縫擴容、2分鍾實現隻讀副本擴容、1分鍾實現全量備份、性能提升6倍,讀性能達到100萬QPS,寫性能達到13萬TPS。
要說為什麼POLARDB一定要實現這些性能頂點?阿裏雲數據庫掌門人餘峰說,今天阿裏雲做的是下一代數據庫,出發點就是希望未來幾年用戶都觸及不到這個天花板,留下時間讓他們繼續創新,不拿出點真本事,何談引領一個時代。
POLARDB實現了節點間共享存儲,讓數據庫可以實現真正的秒級水平擴展,以往這一操作往往需要2天甚至更長。軟硬件一體化的優化,使POLARDB相對於傳統數據庫相同的更新操作減少了50%的磁盤寫入量。並縮短了寫數據的路徑,寫性能顯著提高,讀事務實現優化。
新的3DXpoint存儲介質、NVMe SSD和RDMA網卡等最新的軟硬件優化技術,通過自研的分布式共享存儲引擎Polarstore,實現了低成本,高性能的突破。在標準場景下,POLARDB性能是MySQL的6倍,單實例最大存儲容量實現100TB,而在雲數據庫廠商中,POLARDB性能超越了友商的“阿羅拉”1.2倍,實現了2倍於其單實例最大存儲容量的超越,成為世界級的雲數據庫引導者。
雲計算廠商必須要突破的技術壁壘
阿裏巴巴,對於數據庫的認知可謂異常深刻,早在淘寶初創時期,阿裏巴巴就聚集了中國最頂尖的數據庫團隊,在那個遠沒有今天發達的時代,解決了一個個海量客戶帶來的問題,被國內數據庫行業稱為“黃埔軍校”。
但要從根本上解決問題,則還是要回到數據庫架構技術的突破上。
在經典的數據庫架構中,一個是scale up,一個是scale out。
scale up的優點是能夠迅速的通過硬件疊加的方法快速擴容,這是傳統的商業數據庫中經常采用的一種擴容手段。缺點則是隨著容量的增大,成本將會成倍增長,對於許多初創企業來說,這樣的成本很難接受。
scale out則是通過分布式技術來解決數據庫容量的問題,這個思路來自於穀歌,優點是成本相較於scale up更低,然而缺點也顯而易見,需要對整個應用的底層進行改寫,對於許多複雜的係統來說,這無異於是一場災難。
而POLARDB通過計算與存儲分離的革命設計,既擁有分布式設計的低成本優勢,又具有集中式的易用性,從底層解決了海量數據擴容的問題。同時,通過分布式存儲技術,使數據庫的成本遠低於商用數據庫。
正是有了這樣低成本,高性能,高可靠性的數據庫產品,未來中國才會誕生越來越多的爆發式獨角獸,而無需擔心高昂的數據庫成本與擴容的問題,最大化地利用互聯網的能力、IT基礎設施上輕裝上陣,全麵雲化,用更低的成本、獲得了更好的IT處理能力,這才是未來企業的數字化答案。
就在不久之前,據媒體報道,眾安保險將以750億元的價格在香港上市,而很少有人知道的是,眾安保險從誕生的第一天起,數據就在阿裏雲雲數據庫上。而在全國的各個城市,如火如荼的共享單車背後,雲數據庫支撐著oFo在三個月中從數萬用戶增長到千萬量級。
而今天的雲數據庫市場,這樣的故事正在不斷發生。而在他們身後,阿裏雲用超過10萬個數據庫實例的實踐經驗,帶來了POLARDB。
最後更新:2017-10-13 00:33:23
上一篇:
彈性與性能兼俱,阿裏雲神龍雲服務器全解析
下一篇:
阿裏雲輕量應用服務器解讀,為中小企業提供數字化的解決之道
利用virtual box 自帶remote display 實現windows 遠程桌麵連接ubuntu
ajax中的高級請求和響應
spring使用中報Cannot proxy target class because CGLIB2 is not available錯
Win7怎麼快速開啟Administrator帳號?
java線程學習3——線程的停止
C# 格式化string類型的金額
初創公司談軟件定義存儲:如何借SDI彎道超車
windows中修改catalina.sh上傳到linux執行報錯This file is needed to run this program
《嵌入式C編程:PIC單片機和C編程技術與應用》一1.10 文本格式
JRainbow二次開發手冊