VMware範承工:從數據庫到數據雲 虛擬化搭橋
在2012年8月8日下午舉行的VMware & EMC大數據雲高峰論壇上,VMware全球高級副總裁範承工分享數據管理技術的變遷時表示,數據、雲及雲的使用者的變化帶來的三大趨勢催生了將與傳統數據庫長期共存的數據雲,而虛擬化技術和開源軟件則將架起兩方共同和諧生存的橋梁。
VMware全球高級副總裁範承工
在當前大數據如火如荼的背景下,VMware和EMC雙方聯手舉辦此次論壇,共同就把握雲計算與大數據技術的發展趨勢,結合Hadoop等大數據技術與雲計算所具有的諸多優勢,介紹了其完整的大數據雲解決方案,並分享了諸多客戶成功案例。
範承工從技術角度,分析了數據管理技術變遷的五大趨勢,數據獲取、分析方式的轉變,以及VMware在雲計算與大數據方麵的解決方案。本文將為您介紹這五大趨勢,以及五大趨勢可能帶來的市場格局變化。
三大趨勢催生數據雲
數據庫是現在最領先的一個數據管理模式,它可以把數據進行很好的歸類,關係型數據庫可以把數據組織起來,進行很快的檢索,而且能夠進行交易型的處理。正因為關係型數據庫的產生,使得現在很多的應用都能夠非常順利的進行開發。
而在過去10幾年裏,數據倉庫有了非常快的發展,可以以比較大的數量進行深層次的技術發掘,在數據庫技術底下,為客戶提供更高的價值。
這些意味著,用戶很難把數據庫換掉而不換掉上麵的應用,如果把數據從一種數據庫遷移到另外一種數據庫,不是很容易的事情。
不過,範承工認為,在過去5年裏麵,這種情況有一些改變。他表示,有五個比較大的趨勢,使得一家獨大的數據庫統一數據管理的狀況會有一個比較根本的顛覆。
第一是數據本身的改變。
過去的數據大多是人為產生的,它的數據是一條條記錄式的,比較容易轉化成關係型數據庫形式。對它的處理往往不是實時的,可以等待數據產生,而要應用它的時候,往往已經過了一段時間。在這種情況下,關係型數據庫是一個很好的數字化。舉一個很簡單的例子,我在年初去滑雪,然後去租雪橇,去了一家夫妻店,是一個很小的雪橇店,他們還沒有電腦,沒有數據庫,完全是靠紙和筆記錄每一筆交易。我看到他們有一盒子的卡片,每一筆交易就是一張卡片。還有另外一個盒子是他所有客戶的信息,中間通過客戶的信息可以查每個交易的信息。我再一看,這是用紙做的關係型的數據庫,而這個夫妻店如果生意好,規模大了,就無法用紙和筆來完成,就必須要做成電腦上的數據庫。這樣的數據庫有幾個特點,大家都知道CRUD,需要能夠保證有數據的產生,有數據的讀和寫以及更改,也要保證可以把數據刪除,這是過去所謂的記錄型的數據。而對這種數據的管理,數據庫是一個非常優秀,非常完美的技術。而現在產生數據的源更多了,我們很多的數據不再是由人產生了,而是由機器產生的。隨著物聯網的發展,各種各樣的探測器,各種各樣的RFID,各種各樣移動的手機,各種各樣的器件以及很多電腦、服務器會自動產生大量的數據,而這些數據往往是以流的形式產生的。即使是人為的,包括我們剛才提到的社交網絡、微博,數據的形式和過去的形式也有些不一樣。
我們看到新型的數據往往很少改變過去已經產生的東西,這些數據往往是產生一次,以後就再也不會更改。一個服務器的日誌不會再改變昨天的日誌,我昨天放上一個微博,也不會再進行改變,往往數據產生一次就不會改變。而這些數據很多時候是不會被刪除,即使用戶把它刪除,在背後的基礎架構裏麵往往也是不刪除的。新興的數據底下我們注意到是CRAP的數據模式,是產生、重複、複製,是可以添加的,還必須要進行整合。是這樣一個有流模式大規模數據的產生,但是同時要對它進行一個很好的歸納和整合。對於這樣的數據來說,我們大家熟悉的關係型數據庫已經不再是最優秀的技術能夠滿足他的需要了。在處理這樣大型的 CRAP的數據,我們需要新型的數據管理技術和產品來幫助客戶解決這個問題。這也是現在為什麼包括Hadoop這樣的技術這樣熱門的原因,是因為過去的數據已經滿足不了新型大數據CRAP數據的需求。
第二是雲所帶來的副作用。
雲就在於你的應用不止是在你的防火牆之後。隨著軟件即服務的產生,我們會生活在一個生活雲的時代。對於很多的企業來說,我們很多的應用會是在私有雲裏麵,是在自己的數據中心當中。但是同時我們有越來越多的應用會由公有雲進行提供,包括客戶管理,包括人事管理,甚至以後包括財務管理,都會通過公有雲來提供這樣的應用。而這產生一個副作用,就在於數據往往是跟應用在一起的。當你的應用在你的防火牆之外了,它的數據也在防火牆之外。我作為一個軟件即服務的提供商,提供給你應用,而數據都會在我這裏。我作為一個企業來說,第一次麵對這種情況,企業的數據已經不完全由我來掌控,我不可能把所有的數據都放在甲骨文的數據庫當中。即使我作為CIO有這樣的願望,也無法達成這個現實。因為到底這個應用采用哪個數據庫,已經不是由我這個IT部門說了算了。
在這麼一個多地點、多來源的數據時代,怎麼樣對這些不同的數據方式、不同的數據材料進行統一的分析和處理,從它上麵能夠得到智能是新一代的挑戰。在過去要做一個新的應用,隻要連接到已有的數據庫上就行了。而現在必須要有一個全球的雲數據統一係統,才能夠在上麵開發出新的應用程序,使它能夠提取到你私有雲裏麵的數據,也能夠提取到公有雲的數據。所以這是另外一個雲帶來的趨勢,使得數據管理模式會有一個比較根本的改變。
第三是雲的使用者在進行的改變。
雲使用者的改變也是數據的使用者的改變,在中國很多公司裏麵,最富有的最有實力的500家公司裏麵,可能都會有比較好的數據倉庫係統可以對他的數據進行分析。但是,現在對於數據的需求已經不止是這500家最有實力的公司了,我覺得任何一家公司,任何一個規模的公司,或者任何公司裏的任何一個部門,任何一個小組其實都有需要。為了他能夠在商業上取勝,為了他能夠更好地完成日常工作,都必須從數據當中提取他的智能。而我們現在所熟悉的數據倉庫係統,能夠為數據提供智能的係統是非常昂貴的係統,需要幾百萬美元,幾千萬人民幣的投入,需要專業的團隊,需要很長的時間才能夠得到需要的智能,而並不是所有的公司都能夠有這麼多的錢、人力和專家來達到這個結果。我們的需求就在於怎麼樣能夠有一個低門檻的係統,使得無論是大公司還是小公司,無論是公司裏麵大團隊還是小團隊,都能很容易的從數據當中看到你想看到的信息。我們需要使這個數據的分析係統低門檻,能夠實時的產生這些智能,能夠更加平民化,提供更多的可視性,這也是一個非常大的趨勢。相信在將來的幾年裏麵,我們會發現更多的解決方案,而現在已有的解決方案並不能滿足這方麵的需要。
範承工表示,這三大趨勢產生一個新的數據雲的時代,從過去數據庫一家獨大到新的數據雲,會產生新的需求,產生更大的數據,更快的數據,分布更廣,更多樣的數據,同時這些數據能夠為千家萬戶,為所有的用戶提供服務。
最後更新:2017-04-02 15:15:28