閱讀839 返回首頁    go 京東網上商城


自建的HBase集群遷移過來吧!

引言

最近雲HBase商業化了,HBase在業界應用還是比較廣泛。在雲上環境下中,不少客戶都自建了HBase集群,還有一部分用戶是把HBase集群放在Hadoop離線集群內部。此文主要對比下雲HBase數據庫跟自建HBase的差異。另外,在成本上,雲HBase數據庫跟自建基本差不多,目前雲HBase在推廣打折階段,比自建還便宜不少

自建HBase與ApsaraDB HBase對比

自建目前在雲上,基本是基於ecs去自己構建,ApsaraDB HBase我們還是做了不少事情的:

  • ApsaraDB HBase的內核在阿裏集團使用5年,還是有不少的沉澱的,在一些場景有300%的性能提升,大部分場景都至少有30%的提升,在穩定性恢複恢複速度快3倍左右。阿裏現在有3個hbase pmc,6個committer了,有將近25+個人弄hbase
  • ApsaraDB HBase的內核會主動修複bug,改進功能,升級的,把高版本有價值的patch打到我們的ApsaraDB HBase內核版本上。自己建設 往往要去下載新版本弄,有時候搞不好數據還丟了
  • 安全機製比較健全,如:白名單、VPC、訪問UI的賬號密碼,還有安全部門非得讓弄成https加密的。後續會接阿裏雲的ak,支持共享環境訪問ApsaraDB HBase,比如ODPS,開源版本是不行的
  • 9月份會支持公網開放:比較方便支持線下測試開發連接環境。(不需要vpn、自建線下搭建或者proxy了)
  • 運維還是比較便利的:5分鍾全自動部署新集群、 可以在線擴容磁盤、容量報警、添加節點、修改配置、指標可視化、自動守護進程、鏈路監控報警 、熱點檢測轉移、大scan過期清理 ………………

可以說這個是 ApsaraDB HBase的大概層次圖:
image

關於把Hbase放到離線集群的壞處

之前阿裏雲沒有提供ApsaraDB HBase的產品,在EMR我們包裝了一個開源的HBase,不少用戶就使用了這個HBase,後續造成EMR運維上很大的困難,hbase經常是由於離線作業跑的時候會掛掉,但是這個時候正式需要訪問hbase的時候,如果這個時候有實時入庫或者查詢的操作,則影響非常大。另外,我們還不得不分配一定的資源給Regionserver,RS還是非常吃內存的,造成離線任務根本不夠用的情況。為此,我們就把單獨做了ApsaraDB HBase這個產品,做成全托管的方式,以取代EMR中的HBase

關於節約資源

在用戶自建HBase集群時,不少客戶基於CDH把HBase放在Hadoop中,想法主要是節約一些資源或者麻煩單獨弄一個HBase。其實在雲上環境中,磁盤及CPU及內存都是可以在線直接擴容的,比如ApsaraDB HBase的磁盤可以最低每次8G的擴容,計算資源也可以單獨添加節點。 資源本身基本是很小粒度可以增加的。整體資源其實是相當的(因為HBase需要起著就占資源),另外,如果把分析按量跑,其實成本反到下降不少(EMR支持定時按需跑job)。另外,還可以享受穩定及高性能的服務。

關於性能

spark訪問hbase,再hbase放在hdfs。其實spark並不能享受本地化的好處,spark往往訪問region的,region往往不在這個機器上,比如你有10台機器,則在這個上麵的概率是10%,再region訪問hdfs,則又隻有10%(好的情況可能高點),一算下來,隻有1%的概率可以本地化訪問。且要走2次進程轉化(一般hbase要解壓、反編碼等一些列的操作),其實這個時間遠大於帶寬的傳輸的時間。帶寬傳輸時間基本可以忽略。

ApsaraDB HBase跟客戶的ECS或者EMR連接,采取的是點到點的連通方式,走的是跟ECS自建集群一樣的內網帶寬(完全免費),完全沒有區別,其實就跟訪問集群內部一樣。 跟一些有中轉節點的模式不一樣,ApsaraDB HBase的regionserver都是可以直連客戶端的。
image

帶來的好處
  • 離線可以按需話 - emr提供按需跑的spark,比如晚上跑2個小時等,此極大降低成本
  • 離線基本不影響在線或者近線 - 比如入庫、訪問等不受影響
  • 如果把HBase遷移到ApsaraDB HBase,則享受ApsaraDB HBase的高性能、運維服務及專家服務
寫在最後

如果你想遷移,直接使用copytable拷貝吧,還是挺快的。如果你的數據超過10T,可以聯係我們。 如果你想來試用下,那就直接按需買一個跑跑,最低6元左右一個小時。
ApsaraDB HBase購買地址:https://www.aliyun.com/product/hbase?spm=5176.8142029.388261.280.EZjBmE

最後更新:2017-08-22 13:32:22

  上一篇:go  金融安全資訊精選 2017年第四期:全球安全支出走高,外國銀行再遭黑客襲擊
  下一篇:go  遊戲安全資訊精選 2017年 第四期:遊戲行業上周最大DDoS流量超770G, 魔獸世界遭遇DDoS攻擊,開源CMS Drupal 8發布更新修複多處高危漏洞補丁