886
百度
切分与并行__进阶与深入_数据集成-阿里云
为最大化数据同步的Job传输吞吐量,CDP将对Job进行更细粒度的任务切分,并启动多个数据传输单元进行并行数据同步。CDP的切分规则由CDP框架定义接口,具体切分规则交由具体传输插件负责实现,例如:对于ODPS而言,数据切分根据ODPS表的Record偏移量计算数据分片。对于Mysql Reader插件而言,其切分算法按照Mysql数据表主键范围切分。
以Mysql抽取数据为例,MysqlReader启动后将连接源数据端,计算数据表主键范围,如[Min, Max],并根据用户带宽需求切分上述[Min, Max]区间范围,每个子区间将作为一个Task提交给后续传输单元进行执行。例如,上述Mysql数据表主键范围在[1,4],MysqlReader根据用户需要的吞吐量计算得出数据切分规则需要两个数据子集,因此将数据区间区分为[1, 2]、[3, 4]两个数据子集,两个数据子集交由不同的同步传输单元完成。
最后更新:2016-05-06 10:43:33
上一篇:
最小传输单元__进阶与深入_数据集成-阿里云
下一篇:
数据字段映射__进阶与深入_数据集成-阿里云
企业实名认证__金融云新手上路_金融云-阿里云
查看应用分组__应用分组_用户指南_云监控-阿里云
脚本调试__脚本编写_使用手册_性能测试-阿里云
万网域名解析设置方法__网站解析_产品使用问题_云解析-阿里云
产品名词解释__产品简介_批量计算-阿里云
华为云、腾讯云、阿里云,三虎相争,混战刚刚开始
金融云服务器访问外网的条件__常见问题_专有网络 VPC-阿里云
公共返回参数__公共参数_API参考_弹性伸缩-阿里云
访问域名和数据中心__开发人员指南_对象存储 OSS-阿里云
UploadPartCopy__关于MultipartUpload的操作_API 参考_对象存储 OSS-阿里云
相关内容
常见错误说明__附录_大数据计算服务-阿里云
发送短信接口__API使用手册_短信服务-阿里云
接口文档__Android_安全组件教程_移动安全-阿里云
运营商错误码(联通)__常见问题_短信服务-阿里云
设置短信模板__使用手册_短信服务-阿里云
OSS 权限问题及排查__常见错误及排除_最佳实践_对象存储 OSS-阿里云
消息通知__操作指南_批量计算-阿里云
设备端快速接入(MQTT)__快速开始_阿里云物联网套件-阿里云
查询API调用流量数据__API管理相关接口_API_API 网关-阿里云
使用STS访问__JavaScript-SDK_SDK 参考_对象存储 OSS-阿里云