阿裏雲雙11訪談之ECS彈性計算
以下內容根據訪談視頻整理而成
在2017年,阿裏雲不僅完成了ECS企業級產品的發布,而且完成了一次軟件和硬件的數據迭代,推出了新一代硬件架構和軟件架構產品,同時還持續優化和挖掘現有功能和產品形態優勢,把彈性發揮到極致,在彈性上做了進一步功能優化和深度挖掘。
今年阿裏雲ECS升級帶來了哪些方麵的提升?
在企業線發布之前,很多企業客戶也在使用阿裏雲ECS產品,體驗也還良好。作為產品方,我們很清楚企業在某種特定場景下用當時的產品是否能達到最優的性價比。答案肯定是否定的。所以針對企業的複雜場景,如數據庫、大數據、針對性AI運算等,我們有很多新定義的產品,保證在特定場景下,客戶能選擇最優性價比的產品。這也是阿裏雲發布企業線的根本目的。
如何做到企業級產品在性能和價格上的優化及場景化方式推薦?
在企業級產品的定義裏,我們對各種軟硬件體係架構進行了深度優化。每個企業級場景對性能有不一樣的要求。做數據庫的用戶比較在意磁盤I/O能力的穩定可靠;做大數據的用戶在意的是整個計算機通路的穩定性和可靠性。不同場景有不同的性能偏好屬性。基於這點,通過軟件和硬件的優化和迭代,我們選擇了最合適的硬件和最合適的體係架構,保證在特定場景下,給客戶提供的產品性價比是最優的。綜合來看,在軟硬件體係結構上,我們結合了年中發布的基於新的計算存儲分離的存儲分離架構的Apasara vSwitch第二代新的交換機架構,和依賴底層的新發布的Skylake新一代阿裏巴巴定製處理器,以及底層最強I2數據網絡。綜合整體體係結構全方位提升能力來定義企業級產品線,保證在最新軟件和硬件技術下,整個企業線的極限性能和性價比都是最憂的。
彈性具體體現在產品的那些方麵?
簡單來說,彈性是整個彈性計算產品中一個最大的亮點。彈性計算的彈性體現在兩個方麵,一是資源唾手可得、二是按量付費。用戶無論什麼時候想要計算資源都能拿到,時間上是很彈性的。同時,由於完全根據使用量來計費的,所以付費方式也是很彈性的。
對於用戶來說,彈性體現在哪些價值上?
彈性在阿裏雲雲計算已有結構上用的已經非常成熟了。比如客戶在準備大促活動的時候,傳統方式是提前花費很長時間做預算、采購服務器、上架、準備環境。然後還得保證業務量不會突破事前預估的最大量級。這在整個運營中,由於很難估計真正的運營效果量級,所以效率低,而且成本和後期運營風險也很大。在雲上,客戶可以在任何地點,任何時間點提出資源使用需求,還可以通過彈性API做到在分鍾級創建成百上千的機器。在用戶業務的彈性和業務的支撐能力上,這是一個非常大的提升。在付費方式上,傳統服務器在客戶購買服務器後,隻要上架,無論客戶是否用的上,成本每天都在疊加。在雲上,客戶可以按實際使用時間計算付費。所以對客戶來說,無論在業務承載能力上還是在成本構成上都是極大的提升和優化。
2017年我們有哪些具體彈性服務提升的點?
彈性確實是阿裏雲ECS一直強調的,也是一直在深挖的點。我們做了哪幾件事呢?可以劃分成三大重點:一是我們推出了行業內獨創的包周使用方式。過去客戶隻有按量付費和包年包月兩種選擇形態。今年推出的包周相比包年包月來說是一個更短時間的選擇;二是我們推出了新的競價型實例的購買模式,這種模式能給客戶帶來更好的彈性和更均衡的價格的選擇;三是我們推出了按量付費、按秒計費的技術。按秒計費使計費更加精準,客戶的花銷可以精準到秒的級別,進一步減輕客戶資本壓力。
按周付費相對原有的包年包月付費形態有哪些優勢?
現在大家在ECS的購買頁麵上能夠看到有包周的時間選擇形態,這個形態主要針對用戶短時間使用時的場景。在過去,用戶如果選擇按量付費運營一周或者兩周的時間,整體來說成本是較高的。而如果選擇購買包月付費方式,使用一周後資源就浪費了。前一個選擇使客戶的成本產生浪費,後者使計算資源產生浪費,所以我們推出了包周的使用形態。用戶在用一周或兩周的計算力情況下,不管是對比過去的按量付費還是用包月的方式,包周都可以帶來大約50%的成本節約。
近期上線的競價型實例具有哪些特點呢?
和過去傳統支付方式相比,競價型實例在雲計算資源的使用形態和支付方式都有著顛覆性的變化。因為阿裏雲有很大的資源池和海量用戶,所以在大規模資源的運營和運維的能力技術基礎上,我們可以把資源進行統籌化管理。統籌化管理帶來的好處是對於客戶來說可以彈性地使用計算資源。對我們來說,也能充分發揮空閑資源的價值,所以我們推出了競價型實例這樣的形態。競價型實例可以把價格降低到按量付費的一折起。對於很多的實例類型,通過競價型實例,客戶實際使用的價格可以在一折左右的量級,上限價格是由整體供需關係決定的。也就是說越多用戶在同一時間點請求使用競價型實例,它的價格就會越高。如果客戶在低穀期使用競價型實例,它的價格就會變得很低。所以用戶可以通過競價型實例拿到一個具有非常高性價比的特定計算能力資源。可這種形態非常適用於類似文件渲染這樣的離線業務或對時間不敏感的業務。
新產品神龍雲服務器的特點是什麼?
從產品形態來看,神龍雲服務器具有和物理機一樣的計算能力,沒有任何虛擬化的損失。在維持高計算力的同時,它也和彈性的產品需求結合,保證了產品能夠做到分鍾級別交付、秒級別精準付費。我們通過在整體軟硬件結構上深度定製化以及強大的資源技術做到了這點。客戶為什麼會比較敏感呢?因為目前在擁有物理機級別計算能力的產品形態的基礎上,整個行業內沒有人能夠做到既提供物理機計算力水平又做到分鍾級別交付、秒鍾級別計費,但阿裏雲神龍服務器做到了。神龍雲服務器也是企業級客戶非常適用的高端級產品。客戶可以拿到一個非常完整的與物理機同等水平的計算力又能拿到傳統雲服務器才有的彈性能力,因此是一個非常好的整合。可以說神龍雲服務器是集合了物理機和阿裏雲傳統雲服務器的特點和優勢的一款產品。
新產品企業線實例T5具備哪些優勢?
T5是今年年中的時候發布的企業線實例之一。在企業線發布之前,阿裏雲很多產品都是針對一些入門級場景使用的:共享型實例、入門級實例。過去的共享型實例沒有清晰定義它具備的性能極限是怎樣的,客戶在選擇入門級實例的時候對其性能期望是無法量化的。比如用戶期望用一台實例承擔計算業務。當業務高峰期來臨,因為共享資源,計算力可能衰減導致這台實例承載不了他期望的計算力。我們在定義T5突發性能實例的時候,著重對這方麵進行了優化。T5係列的每一款實例類型都具備非常清晰的性能極限,這個極限的含義就是用戶可以期望實例在這個計算力水平上穩定運行。同時,因為自身業務峰值和穀值原因,能夠把計算力節省下來提供給突發峰時候利用。這對客戶來說有了非常精細的計算力規劃。不管是在數量上還是在單時的性能上,客戶都可以非常有針對性的進行選擇。相對於之前幾代的實例,在成本上也有很大的降低。單實例的降價範圍能達到百分之十到百分之四十的區間範圍。
在產品的穩定性和安全性方麵,ECS今年有哪些重大的突破?
穩定性和安全性是從ECS上線之初阿裏雲就一直強調的兩點。因為我們主打將客戶業務搭建在阿裏雲上,所以穩定性和安全性是ECS產品最基本的前提。我們今年在維持高穩定性和高數據安全性的前提保障基礎上,保證將數據可靠性做到九個九的量級。這在行業內也達到了頂級的水平。同時在服務可靠性方麵,我們做到了三個九、一個五的高水平。
ECS產品在技術上如何做到九個九和三個九、一個五的指標?
這個技術涉及範圍很廣,我們可以從客戶不太關注的方麵來聊一聊。穩定性和可靠性需要軟硬件體係架構全體係的優化提升。取個底層的例子:在IDC的選擇方麵。阿裏雲所有IDC選的都是行業內最頂級的IDC。這可以帶給我們怎樣的能力呢?比如每個機房都要求具備雙獨立的市電供給,也就是說每個電源都必須來自兩個獨立的供電站。任何一個供電站出現故障都不會影響機房電力的穩定供給。在此基礎上我們還提供了具備一段時間持續供電能力的電池和柴油發電機,保證在突發事件導致雙電路斷電情況下,機房依然可以通過電池短時間供電,再換上柴油發電機供電使機房穩定運行。另外一個客戶不太關心的點是ECS所有選擇的IDC的機房在網絡上都做到了3+A網絡接入,保證客戶的終端使用時,網絡延遲是最小的,比如小於40ms的網絡訪問延時。再有一點,在保證網絡的穩定性上保證每個IDC光纖接入的冗餘度。保證單一光纖突發故障時,網絡數據的穩定性傳輸。這就是我們在底層做到的兩點。同時,在多程序之間、在軟件架構上,所有網絡體係裏所有的節點連接都不是單節點相連的,保證任意單節點的失效不會影響到業務的穩定性。以上都是我們前麵提到的N個9的技術支撐。
對於一些中小企業或者個人用戶怎樣能快速上手ECS產品?
前麵提到的那些點大家可以不需要太過糾結。客戶隻要知道我們的服務是非常穩定可靠的就夠了。阿裏雲ECS產品是一種服務級形態產品,最終達到的是交付服務的狀態。在過去,作為一個IDC的租用者,你需要關注比如剛剛提到的電力的能力、網絡的能力等這些保證最終服務交付能力的每一個點。現在,這些能力在阿裏雲上隻是最基本的能力原子單位。阿裏雲最終保證的是交付給客戶的服務可用性,客戶隻需要關注服務可用性就,不需要過多了解底層技術。換一個角度來看,由於人力投入和資源投入的有限性,小客戶在傳統租IDC的時候,跟大客戶、大型IDC租用者相對比,業務穩定性和彈性能力是有很大的差別的。這種差別在雲上麵完全被阿裏雲抹平化了。即使是個非常小的用戶,在雲上也可以拿到跟跨國企業、巨頭公司相同的計算穩定度和服務等級的資源,這也是一個非常大的顛覆。
應該如何挑選ECS產品使業務實際需求得到滿足?在離線業務和在線業務這兩種場景下客戶應該如何選擇比較好?
區分客戶業務最基本的判斷就是客戶業務是在線業務還是離線業務。在線業務是非常典型的。雙十11對電商類客戶是一個重大的節日,在做雙11大促活動的時候,客戶一定會在雲上或線下IDC搭建業務,包括購物類等所有環節的應用服務器。這種服務器在雲上提供了幾種機型選擇。客戶如果在選擇機型的時候沒有一個清晰的認知,在做在線業務搭建的時候,我推薦在雲上選擇通用型服務器。這種服務器的場景定義範圍非常廣泛,計算能力、存儲能力、網絡能力非常均衡。客戶不清楚自己要什麼的時候先選它基本不會錯,使用過程中,如果發現某一方麵能力遇到瓶頸,客戶可以將實例變配升級到其他的實例類型,這對在線業務是一個非常好的選擇。
針對數據庫場景是不是選用通用型實例比較好呢?
數據庫場景有些不一樣。在剛推出企業線的時候,提供給客戶的數據庫選擇幾乎就是通用型實例和大內存實例搭配SSD雲盤兩種方案。現在企業級實例已經非常豐富,所以可以推薦給客戶一個更好的選擇。對於中低端性能需求的用戶,用通用型實例搭配SSD雲盤性價比和數據的可靠性都很高。對於高端性能需求用戶,比如巨頭型客戶,它期望在雲上有非常高的性能。客戶的核心數據庫對磁盤的I/O性能需要百萬級別的iops指標。這種場景下用雲盤會有瓶頸點。我們推薦使用I係列,也叫本地SSD型實例,I1 和I2是最新的兩代實例,i2提供的單實例能力上限可達210萬iops能力。這和雲盤數據庫實例有一定的差別。雲盤數據庫實例客戶不需要擔心數據可靠性。因為阿裏雲對雲盤做了三副本,保證數據不會丟失。在I係列產品為了一個非常高的性能,它在底層數據副本上麵我們沒有做三副本,用戶需要在應用層關注數據可靠性的問題。這對於大客戶來說並不是問題,他可以用數據庫的同步來解決這個數據冗餘的問題。
離線的業務場景有哪些合適的產品可供選擇?
離線的業務非常多。從客戶的各種場景來看,企業渲染就是很典型的一種。現在大數據是大家都關注的一個點。大數據在收集海量數據,分析客戶的行為分析等方麵各個企業都有使用。在這種大數據場景下,在企業級發布之前,我們提供了雲盤和通用型實例的搭配來運行一些大數據場景。現在,我們推出一款大數據機型。我們分析發現客戶基於雲盤搭建大數據場景時,產生了非常大的浪費和性能的瓶頸。因為雲盤是三副本,如果在應用層也做數據三副本保護,每個數據就有九個副本,這導致一個很大的存儲空間的浪費。因此在保證性能提升的前提下,基於本地的SSD盤產品形態能大幅度降低成本。大數據場景有計算、存儲、網絡三個通路非常均衡的特點。我們在定義實例時也在底層的網絡能力上進行了充分的優化,搭配了vSwitch第二代來保證計算和存儲網絡都非常均衡。大數據存儲存儲I/O可以達到40Gb的磁盤吞吐上限,也就是5GB的存儲能力。可以理解為用戶在計算,存儲到網絡通路是沒有瓶頸的。這對用戶來說是一個非常好的場景性價比的體現。
除了大數據場景,阿裏雲自己也在做AI深度學習探索。針對這樣的場景沒有一些特殊的選擇可以推薦?
今年AI是一個熱點話題,阿裏雲一直很重視它,ECS產品也在AI方麵做了很多產品和工作。深度學習裏GPU計算卡是不可繞過去的點。我們今年在行業中首先推出了一款,基於PE版計算卡的實例類型——gn5實例。這個實例搭配了pe版計算卡,計算力與之前的機型相比有質變的提升。同時對於AI場景,用戶可能最關注線下的訓練和在線的推理兩個場景。用戶可能會將PE版作為線下訓練的選擇。對於在線推理場景,由於客戶需求特點,單卡的計算力不需要特別強,但是成本盡量低於基於P4計算卡。同時,gn5i完成了在深度學習AI場景裏訓練和推理的完整的整合,提供給客戶在不同場景下最憂性價比的產品選擇。
結合彈性這一塊,用戶在實際購買產品的時候應該怎樣購買才會更合適呢?
在彈性方麵我們提供給客戶的選擇越來越多,不同的選擇在不同的應用場景裏有不同的偏向。我們建議客戶在建在線業務場景時,使用包年包月的購買方式來解決長時間穩定的需求。對於臨時業務峰值,比如雙11大促,可以用按量付費的方式購買資源。這樣做的好處是價格雖然貴一點,但資源獲得性準確,不用擔心資源會被釋放掉。針對離線業務場景,客戶不需要選擇按量付費。離線業務對於時間沒有很強的敏感性,使用包年包月方式解決長時間需求是可以。通過購買spot方式解決臨時需求,搭建大數據運算或離線訓練,都可以得到最好的性價比。
針對離線和在線混布的場景我們該如何選擇?
離線和在線混布是真正的雲用戶用的很深透的場景。舉個典型的例子,客戶白天的業務是在線需求響應業務,晚上在線業務處於低穀期。可以通過雲上快速鏡像打包和還原能力,把實例快速切換成離線分析處理實例來解除在線所占資源,這個通過在線API可以很快完成在線業務處理實例和大數據純計算切入節點的切換,用戶通過錯峰填穀來保證業務進行利用率達到最高水平,同時成本也是最低的。
針對ECS彈性計算,阿裏雲雙11都有哪些優惠?
購買首台所有規格實例的新購用戶都能享受到五折的優惠。針對老用戶,在續費優惠中,我們推出一年付八折優惠活動。除了有新購五折和續費八折優惠,部分實例會推出六到七折的優惠活動,這些優惠都是不限實例台數,大家可以持續關注雙11分會場獲取更多阿裏雲雙十一優惠活動信息。
最後更新:2017-10-30 09:03:35