CIO 指南:如何在 SAP® 軟件架構中使用 Hadoop
Gartner指出,2013年,大數據是影響信息架構的最重要的技術趨勢之一。“信息的數量、生成速度和種類都在不斷增加,而且那些未被治理和未得到充分利用的信息中蘊藏著巨大的價值,同時也隱藏著潛在的風險。在這些因素的驅動下,信息管理技術與實踐領域的重大創新層出不窮。”
SAPHANA能夠幫助企業解決一個非常重要的大數據問題,那就是快速訪問和實時分析極其龐大的數據集。這樣,企業的管理人員和高管就能以思維般的速度了解自身的業務狀況,充分挖掘信息的價值。另外,SAP還發布了SAPReal-TimeDataPlatform(SAPData-baseandDataManagement的前身)。該平台整合了SAPHANA和SAPIQ,以及其他SAP技術和非SAP技術,特別是Hadoop,其中Hadoop就是本文探討的對象。SAPReal-TimeDataPlat-form可以用於分析處理和聯機事務處理(OLTP)。盡管單獨使用時,每項技術也能交付業務價值,但若結合使用,這些技術就能整合、分析和處理企業擁有的所有數據,進而提供更深入的業務洞察,並創造新的業務機會。
為了在眾多數據技術中找到最佳的平衡點,解決業務問題,企業必須考慮諸多因素。除了軟硬件成本外,企業還必須考慮開發工具、與滿足其服務水平相關的運營成本,以及如何落實有關安全性、高可用性、安全備份和數據恢複的各項政策。
這就提出了兩個問題,同時也是本文要回答的兩個問題:
•在什麼情況下,Hadoop是解決業務問題的最佳方案?
•如何將Hadoop與SAP的解決方案及技術結合使用?
這些技術之間存在著許多重大差異。一方麵,Hadoop采用商用服務器處理PB級甚至EB級數據,這遠遠超過了SAPHANA和傳統關係數據庫管理係統(RDBMS)的處理能力,後者處理的數據規模通常為100TB級或更低。3另一方麵,當前Hadoop版本的速度明顯比傳統的RDBMS和SAPHANA要慢,需要花費數分鍾或數小時才能提供分析結果。但是,這些版本能更輕鬆地處理任意數據結構,而且每TB數據的硬件存儲成本通常更低。
這就意味著,Hadoop與SAPHANA不同,它無法支持你以思維般的速度了解業務狀況。但是,Hadoop能幫助你以更低的成本存儲和訪問更多更詳細的數據,從而以不同的方式更深入地了解企業的基礎數據。
最終,通過將SAPHANA與Hadoop相結合,你能夠快速處理真正的大數據。
最後更新:2017-11-03 11:04:06