閱讀354 返回首頁    go 阿裏雲


什麼是MaxCompute__產品簡介_大數據計算服務-阿裏雲

MaxCompute簡介

大數據計算服務(MaxCompute,原名ODPS)是一種快速、完全托管的TB/PB級數據倉庫解決方案。MaxCompute向用戶提供了完善的數據導入方案以及多種經典的分布式計算模型,能夠更快速的解決用戶海量數據計算問題,有效降低企業成本,並保障數據安全。MaxCompute主要服務於批量結構化數據的存儲和計算,可以提供海量數據倉庫的解決方案以及針對大數據的分析建模服務。隨著社會數據收集手段的不斷豐富及完善,越來越多的行業數據被積累下來。數據規模已經增長到了傳統軟件行業無法承載的海量數據(百GB、TB、乃至PB)級別。在分析海量數據場景下,由於單台服務器的處理能力限製,數據分析者通常采用分布式計算模式。但分布式的計算模型對數據分析人員提出了較高的要求,且不宜維護。使用分布式模型,數據分析人員不僅需要了解業務需求,同時還需要熟悉底層計算模型。MaxCompute的目的是為用戶提供一種便捷的分析處理海量數據的手段。用戶可以不必關心分布式計算細節,從而達到分析大數據的目的。MaxCompute已經在阿裏巴巴集團內部得到大規模應用,例如:大型互聯網企業的數據倉庫和BI分析、網站的日誌分析、電子商務網站的交易分析、用戶特征和興趣挖掘等。

MaxCompute組件介紹

  • 數據通道:
    • TUNNEL:提供高並發的離線數據上傳下載服務。用戶可以使用Tunnel服務向MaxCompute批量上傳或下載數據。MaxCompute Tunnel僅提供Java編程接口供用戶使用。
  • 計算及分析任務:
    • SQL :MaxCompute隻能以表的形式存儲數據,並對外提供了SQL查詢功能。用戶可以將MaxCompute作為傳統的數據庫軟件操作,但其卻能處理TB、PB級別的海量數據。需要注意的是,MaxCompute SQL不支持事務、索引及Update/Delete等操作,同時MaxCompute的SQL語法與Oracle,MySQL有一定差別,用戶無法將其他數據庫中得SQL語句無縫遷移到MaxCompute上來。此外,在使用方式上,MaxCompute SQL最快可以在分鍾,乃至秒級別完成查詢,無法在毫秒級別返回用戶結果。MaxCompute SQL的優點是對用戶的學習成本低,用戶不需要了解複雜的分布式計算概念。具備數據庫操作經驗的用戶可以快速熟悉MaxCompute SQL的使用。
    • MapReduce :MapReduce最早是由Google提出的分布式數據處理模型,隨後受到了業內的廣泛關注,並被大量應用到各種商業場景中。在本文檔中,我們會對MapReduce模型做簡要介紹,以便於用戶快速熟悉、了解該模型。使用MaxCompute MapReduce的用戶需要對分布式計算概念有基本了解,並有相對應的編程經驗。MaxCompute MapReduce為用戶提供Java編程接口。
    • Graph:MaxCompute提供的Graph功能是一套麵向迭代的圖計算處理框架。圖計算作業使用圖進行建模,圖由點(Vertex)和邊(Edge)組成,點和邊包含權值(Value)。通過迭代對圖進行編輯、演化,最終求解出結果,典型應用:PageRank單源最短距離算法K-均值聚類算法 等等。
  • SDK:提供給開發者的工具包,SDK的相關介紹請參考 SDK介紹
  • 安全:MaxCompute提供了功能強大的安全服務,為用戶的數據安全提供保護,詳情請參考 安全參考手冊

如果想快速了解如何使用MaxCompute,請參考 快速開始;

最後更新:2016-12-14 09:50:32

  上一篇:go 消息隊列 MQ 如何授權__技術分享_技術運維問題_消息隊列 MQ-阿裏雲
  下一篇:go 導讀__產品簡介_大數據計算服務-阿裏雲