透過DB-Enginges,看數據庫管理係統的潮起浪湧
數據庫管理係統的新興和敗落趨勢
如今的數據庫技術文章中,常常充滿了流行詞匯和對於新趨勢的預言,就像其他技術領域一樣。今天通過DB-Enginges排序收集到的數據,來看一下這些趨勢。
為了進行我們的DB-Enginges排序,我們製定了一個普及度值,並參照我們的排序方法對每個DBMS進行了排序。然後通過簡單的添加每種係統所具有的明確相關值,製作了普及趨勢曲線。我們把普及度值在所有係統中占的百分比用來展示發展趨勢。
NoSQL
在過去的幾年裏,很多新興的DBMS(數據庫管理係統)被創造出來。它們常常支持很多種超出之前固有關係模型的數據模型。這主要是被新應用(比如網絡事物、非結構化數據管理、複雜關係模型等)的需求所驅動。很多該類係統被證明是極其成功的,並且導致有一些預言家預言關係型數據庫很快會消亡。他們的觀點正確嗎?
讓我們看一下過去幾年從DB-Engines數據集導出的圖表吧。
從2013年2月到2016年10月剛統計的數據中,可看到關係型數據庫的普及率從原先的94%下跌到了81%。為了方便起見,我們用NoSQL代表所有的非關係型數據庫,那麼,這個族群從6%漲到了19%,在這個時期增長了三倍。但是,去年的普及率清晰地表明這個趨勢似乎已經停止了,並且關係型數據庫仍停留在一個較高的水平。
隻從普及率變化的部分(並且忽略絕對值)分析,圖形數據庫從2013年1月到現在增長了近6倍。它們支持列存儲和文檔存儲。
對過去12個月做了相同的分析,發現時間序列數據庫是當今成長最快的數據庫類型:
所有類型的數據庫管理係統的統計表可以在這裏找到:https://db-engines.com/en/ranking_categories。
雲數據庫
參照我們對於DBaaS產品的嚴格定義(請看描述https://db-engines.com/en/blog_post/37),我們繪出了其增長趨勢,如下圖:
雲數據庫的普及率從2013年1月的0.1%增長到了今天的1.4%,並且這種趨勢還在繼續發展。
開源數據庫
開源數據庫備受歡迎:最近普及率占45%,4年前為36%。但是每個月都會明顯增長的趨勢也已經不甚明顯。
第二部分原標題:Exploring the trend towards open source database management systems
地址: https://db-engines.com/en/blog_post/65
作者:Matthias Gelbmann
二、開源數據庫管理係統的發展趨勢
開源數據庫管理係統的普及,像在DB-Engines測量生成的排行那樣,已經突破到一個新的記錄。這裏我們分析了一些潛在的細節。
在我們的排行中有154種開源係統,略微少於156種商業係統。如果我們把所有開源係統的普及度加起來的話,結果占到總體分數的46%,然而,54%為商業係統。
雖然商業係統目前領先,但縱觀曆史發展趨勢,我們認為這正在改變。因為開源係統的普及份額從4年前的35%增加到如今46%的新記錄。
但這種變化從何而來?它不像Oracle、微軟和IBM這類公司在慢慢地開源其核心技術。
有2個實際的主要因素。首先,現有商業數據庫的流行發展趨勢呈現出不同的景象。Oracle在2015年成為我們所用的數據庫,當時我們發現它的普及率增長達到了最高。類似的,微軟的SQL Server到目前為止已經有持續一年的強勁發展,在過去的12個月內獲得91個得分點。另一方麵,競爭中有市場衝突的係統失去了普及度,比如DB2和微軟Access。
現有的開源係統在普及度上平均水平更勝一籌。MySQL的得分曾經起起伏伏,但是近期呈現一個強勢的整體上升趨勢。
並且PostgreSQL,SQLiet和MariaDB在我們排行中的得分都一直在增長。
因此,這是我們觀察到的趨勢的一個來源:現有的開源係統比他們的商業係統小夥伴發展好一些。但是還有更多的重要的潛在原因。
看一下通過數據庫模式分解的開源係統的份額:多值數據庫、麵向對象數據庫和純XML數據庫。關係型數據庫在相對中間的區間。
在左邊,我們看到大多數新類型的係統種開源係統占很大的份額:列存儲、圖形數據庫、時間序列數據庫、文檔數據庫,還有不那麼年輕的鍵值存儲。在右側,我們看到有一些份額較大的相對成熟的商業係統類型:
將這些信息與各種數據庫增長率相結合,我們可以看到開源係統發展趨勢的主要原因:
最上麵的有最高增長率並且是高份額的開源係統,相反在底部,這些係統的增長率最低的主要由商業係統組成。
仔細觀察每種數據模型的普及率排行,可以清晰地看到:
-
所有列存儲數據庫名列前茅的是開源的:Cassandra, HBase, Accumulo等等。
-
所有圖形數據庫名列前茅的是開源的:Neo4j, OrientDB, Titan等等。
-
所有鍵值存儲名列前茅的都是開源的: Redis, Memcached,Riak KV等等。
-
所有時間序列數據庫名列前茅的都是開源的: InfluxDB,RRDTool, Graphite等等。
-
所有文檔存儲數據庫名列前茅的都是開源的:MongoDB, Couchbase,CouchDB等等。這裏值得注意的例外是Amazon DynamoDB,一個基於雲的係統,它暗示了另外一種發展趨勢。
-
最後,搜索引擎名列前茅的也是開源的:Elasticsearch 和 Solr。
開源係統的發展趨勢似乎不可阻擋。這對數據庫產業來說是好消息。它意味著,對用戶來說,這是一個既強大又實惠的巨大選擇。另一方麵,大量的公司已經證明,開源係統可以構建堅固的業務係統,他們用在核心業務係統上,支持著產品和服務。商業係統不會很快消失,因為有一部分人需要或者是傾向於有許可的係統。數據庫的大陸版圖無疑已經大的足夠能容下所有族群了。
原文發布時間為:2016-12-07
本文來自雲棲社區合作夥伴DBAplus
最後更新:2017-05-11 14:31:22