886
魔獸
切分與並行__進階與深入_數據集成-阿裏雲
為最大化數據同步的Job傳輸吞吐量,CDP將對Job進行更細粒度的任務切分,並啟動多個數據傳輸單元進行並行數據同步。CDP的切分規則由CDP框架定義接口,具體切分規則交由具體傳輸插件負責實現,例如:對於ODPS而言,數據切分根據ODPS表的Record偏移量計算數據分片。對於Mysql Reader插件而言,其切分算法按照Mysql數據表主鍵範圍切分。
以Mysql抽取數據為例,MysqlReader啟動後將連接源數據端,計算數據表主鍵範圍,如[Min, Max],並根據用戶帶寬需求切分上述[Min, Max]區間範圍,每個子區間將作為一個Task提交給後續傳輸單元進行執行。例如,上述Mysql數據表主鍵範圍在[1,4],MysqlReader根據用戶需要的吞吐量計算得出數據切分規則需要兩個數據子集,因此將數據區間區分為[1, 2]、[3, 4]兩個數據子集,兩個數據子集交由不同的同步傳輸單元完成。
最後更新:2016-05-06 10:43:33
上一篇:
最小傳輸單元__進階與深入_數據集成-阿裏雲
下一篇:
數據字段映射__進階與深入_數據集成-阿裏雲
企業實名認證__金融雲新手上路_金融雲-阿裏雲
查看應用分組__應用分組_用戶指南_雲監控-阿裏雲
腳本調試__腳本編寫_使用手冊_性能測試-阿裏雲
萬網域名解析設置方法__網站解析_產品使用問題_雲解析-阿裏雲
產品名詞解釋__產品簡介_批量計算-阿裏雲
華為雲、騰訊雲、阿裏雲,三虎相爭,混戰剛剛開始
金融雲服務器訪問外網的條件__常見問題_專有網絡 VPC-阿裏雲
公共返回參數__公共參數_API參考_彈性伸縮-阿裏雲
訪問域名和數據中心__開發人員指南_對象存儲 OSS-阿裏雲
UploadPartCopy__關於MultipartUpload的操作_API 參考_對象存儲 OSS-阿裏雲
相關內容
常見錯誤說明__附錄_大數據計算服務-阿裏雲
發送短信接口__API使用手冊_短信服務-阿裏雲
接口文檔__Android_安全組件教程_移動安全-阿裏雲
運營商錯誤碼(聯通)__常見問題_短信服務-阿裏雲
設置短信模板__使用手冊_短信服務-阿裏雲
OSS 權限問題及排查__常見錯誤及排除_最佳實踐_對象存儲 OSS-阿裏雲
消息通知__操作指南_批量計算-阿裏雲
設備端快速接入(MQTT)__快速開始_阿裏雲物聯網套件-阿裏雲
查詢API調用流量數據__API管理相關接口_API_API 網關-阿裏雲
使用STS訪問__JavaScript-SDK_SDK 參考_對象存儲 OSS-阿裏雲