871
windows
產品與技術__產品簡介_數據集成-阿裏雲
CDP定義隻完成數據同步/傳輸過程,並且整體數據傳輸過程完全控製於CDP同步集群模型下,同步的通道以及同步數據流對用戶完全隔離。同時,CDP本身不提供傳輸同步數據流的消費功能,即用戶不能直接通過CDP的API消費數據流,所有針對數據操作,用戶必須在同步數據流兩端存儲端操作。如下圖所示:
二、技術與原理
CDP在阿裏雲上提供一套分布式離線數據同步平台,同時提供一套抽象化的數據抽取插件(稱之為Reader)、數據寫入插件(稱之為Writer),並基於此框架設計一套簡化版的中間數據傳輸格式,從而達到任意結構化、半結構化數據源之間數據傳輸之目的。從用戶角度來看,一個CDP運行Job示意圖如下:
上述中,虛線代表API調用控製,灰色方向箭頭代表數據流向。圓形節點代表底層一台數據同步執行節點,黑色節點代表正在執行當前數據同步業務的執行節點。下麵簡要描述用戶使用CDP Job API觸發調用CDP的Job同步過程:
• 用戶使用CDP Job啟動API,向CDP服務端發起調用,提交一個離線數據同步Job。
• CDP收到Job API請求後,將負責做必要的安全和權限校驗,待校驗通過後,CDP會下發相應的Job到執行集群節點啟動離線數據同步任務。
• Job啟動後,根據用戶提供源端(Reader)、目的端(Writer)的配置信息,加載並初始化相關插件,連接兩端數據源,開始數據同步工作。
• Job運行過程中,將隨心跳向CDP匯報當前進度、速度、數據量等關鍵運行指標,用戶根據Job的狀態API實時獲取該Job運行狀態,直至Job運行結束(成功或者失敗)。
最後更新:2016-11-24 11:23:47
上一篇:
服務SLA__公眾趨勢分析-阿裏雲
下一篇:
同步概念__產品概念_產品簡介_數據集成-阿裏雲
過濾參數__性能優化設置_用戶指南_CDN-阿裏雲
企業郵箱在手機移動端郵件軟件設置方法__郵箱設置_郵箱常見問題_企業郵箱-阿裏雲
阿裏雲流計算服務協議__相關協議_平台介紹_數加平台介紹-阿裏雲
獲取信息__獲取圖片信息_圖片處理指南_對象存儲 OSS-阿裏雲
Redis-cli連接__連接實例_快速入門_雲數據庫 Redis 版-阿裏雲
阿裏雲歸檔存儲簡介__API使用手冊_歸檔存儲-阿裏雲
查詢錄製索引文件__直播流操作接口_API 手冊_CDN-阿裏雲
修改消息可見時間__隊列接口規範_API使用手冊_消息服務-阿裏雲
資源報表__控製台使用指南_消息隊列 MQ-阿裏雲
添加刪除用戶__快速開始_大數據計算服務-阿裏雲
相關內容
常見錯誤說明__附錄_大數據計算服務-阿裏雲
發送短信接口__API使用手冊_短信服務-阿裏雲
接口文檔__Android_安全組件教程_移動安全-阿裏雲
運營商錯誤碼(聯通)__常見問題_短信服務-阿裏雲
設置短信模板__使用手冊_短信服務-阿裏雲
OSS 權限問題及排查__常見錯誤及排除_最佳實踐_對象存儲 OSS-阿裏雲
消息通知__操作指南_批量計算-阿裏雲
設備端快速接入(MQTT)__快速開始_阿裏雲物聯網套件-阿裏雲
查詢API調用流量數據__API管理相關接口_API_API 網關-阿裏雲
使用STS訪問__JavaScript-SDK_SDK 參考_對象存儲 OSS-阿裏雲