HBase全網最佳學習資料匯總
前言
HBase這幾年在國內使用的越來越廣泛,在一定規模的企業中幾乎是必備存儲引擎,互聯網企業阿裏巴巴、百度、騰訊、京東、小米都有數千台的HBase集群,中國電信的話單、中國人壽的保單都是存儲在HBase中。注意大公司有數十個數百個HBase集群,此點跟Hadoop集群很不相同。另外,數據需求,很多公司是mysql+hbase+hadoop(spark),滿足關係型數據庫需求,滿足大規模結構化存儲需求,滿足複雜分析的需求。如此流行的原因來源於很多方麵,如:
- 開源繁榮的生態:1. 任何公司倒閉了,開源的HBase還在 2.幾乎每家公司都可以去下載源碼,改進她,再反饋給社區,就如阿裏已經反饋了數百個patch了。加入的人越多,引擎就越好
- 跟HADOOP深度結合:本就同根同源,在數據存儲在HBase後,如果想複雜分析,則非常方便
- 高擴展、高容量、高性能、低成本、低延遲、稀疏寬表、動態列、TTL、多版本等最為關鍵,起源google論文,發揚社區及廣大互聯網公司,設計之初就是為存儲互聯網,後經過多年的改進升級,如今已經是結構化存儲的事實標準
書籍
最好買紙質書籍,集中時間看下
- HBase權威指南(HBase: The Definitive Guide):理論多一些
- HBase實戰:實踐多一些
總結性
- HBase2.0: HBase2.0 :預計今年會發布,hbase2.0是革命性的版本
- HBase Phoenix:Apache Phoenix與HBase:HBase之上SQL的過去,現在和未來
- 社區hbase博客:https://blogs.apache.org/hbase/
方法論
- HBase使用場景和成功案例 存儲互聯網的初心不變
- 一種基於物聯網大數據的設備信息采集係統及方法:怎麼使用HBase、sparkStreaming、redis處理物聯網大數據
各大公司的實踐
基本圍繞在用戶畫像、安全風控、訂單存儲、交通軌跡、物理網、監控、大數據中間存儲、搜索、推薦等方麵:
- 阿裏巴巴-大數據時代的結構化存儲HBase在阿裏的應用實踐:講述在阿裏巴巴集團的實踐,HBase在阿裏集團已經10000台左右,主要在訂單、監控、風控、消息、大數據計算等領域使用
- 阿裏巴巴搜索-Hbase在阿裏巴巴搜索中的完美應用實踐:講述在搜索場景下hbase的應用及相關的改進
- 滴滴-HBase在滴滴出行的應用場景和最佳實踐:統計結果、報表類數據、原始事實類數據、中間結果數據、線上係統的備份數據的一些應用
- HBase在京東的實踐 :跟阿裏一樣,京東各個業務線使用了HBase,如:風控、訂單、商品評價等
- 中國人壽基於HBase的企業級大數據平台:使用一個大跨表存儲所有的保單,HBase寬表的實踐
- HBase在Hulu的使用和實踐:用戶畫像、訂單存儲係統、日誌存儲係統的使用
- Apache HBase at Netease:在報表、監控、日誌類業務、消息類業務、推薦類業務、風控類業務有所使用,另外講述了一些優化的點。
- 10 Million Smart Meter Data with Apache HBase:講述Hitachi為什麼選擇hbase及在HBase方麵的應用
- G7:如何用雲計算鏈接30萬車輛--EMR&Hbase 在物聯網領域的實踐及解決方案 講述了怎麼使用spark及hbase來滿足物聯網的需求
HBase資料庫
結尾
這些資料是筆者整理,以供有大規模結構化需求的用戶及HBase愛好者學習交流,以使用HBase更好的解決實際的問題。
交流群
如果大家對HBase有興趣,致力於使用HBase解決實際的問題,歡迎加入阿裏雲Hbase技術交流群交流.
歡迎加入阿裏雲雲HBase技術交流群
釘釘阿裏雲hbase交流群
聲明
以上資料來自互聯網,如果侵權,請聯係我刪除
最後更新:2017-08-13 22:19:48