541
魔兽
数据归档MaxCompute__高级特性_DataHub实时数据通道_大数据计算服务-阿里云
DataHub Connector是把 DataHub 中的实时数据归档到其他存储系统的功能,目前只支持将Topic中的数据归档到MaxCompute(ODPS)中。数据归档到MaxCompute支持at least once语义,在网络服务异常等场景下可能会导致导入到MaxCompute中的数据产生重复。
如何创建
创建Connector主要需要如下前置条件:
准备对应的MaxCompute表,该表字段类型、名称、顺序必须与DataHub Topic字段完全一致,如果三个条件中的任意一个不满足,则归档Connector无法创建。字段类型对应表见后表。
访问MaxCompute账号的设置,该账号必须具备该MaxCompute的Project的CreateInstance权限和归档MaxCompute表的Desc、Alter、Update权限,建议使用一个特殊最小权限的账号(如何配置访问MaxCompute账号权限?)。建议使用RAM用户账号(如何创建RAM用户账号?)。
DataHub Topic的Owner/Creator账号, 才有相应的权限操作Connector,包括创建,删除等。
操作流程: Project列表->Project查看->Topic查看->点击归档MaxCompute->填写配置,点击创建
进入Topic的详情页面:
配置Connector 并创建:
在Connector页面查看数据归档状态:
配置说明
名称 | 是否必须 | 描述 |
---|---|---|
MaxCompute Project | yes | MaxCompute Project名称 |
MaxCompute Table | yes | MaxCompute表名称 |
AccessId | yes | 访问MaxCompute的阿里云账号AccessID |
AccessKey | yes | 访问MaxCompute的阿里云账号AccessKey |
注意
1 支持MaxCompute分区表,例如:
MaxCompute表:
table_test(f1 string, f2 string, f3 double) partitioned by (pt string)
对应Topic应为如下:
topic_test(f1 string, f2 string, f3 double, pt string)
2 MaxCompute分区字段必须为STRING类型。
3 数据归档的频率为每个Shard每5分钟或者Shard中新写入的数据量达到64MB,Connector服务会批量进行一次数据归档进入MaxCompute表的操作。所以数据写入DataHub Topic后至多5分钟后在MaxCompute可以被查询到。
DataHub与MaxCompute字段类型对应表
MaxCompute表中的类型 | DataHub Topic中的类型 |
---|---|
STRING | STRING |
DOUBLE | DOUBLE |
BIGINT | BIGINT |
DATETIME | TIMESTAMP |
BOOLEAN | BOOLEAN |
DECIMAL | 不支持 |
MAP | 不支持 |
ARRAY | 不支持 |
最后更新:2016-11-24 11:23:49
上一篇:
Web控制台介绍__使用指南_DataHub实时数据通道_大数据计算服务-阿里云
下一篇:
扩容缩容Merge/Split__高级特性_DataHub实时数据通道_大数据计算服务-阿里云
本地IDC自建数据库同RDS实例实时同步__最佳实践_数据传输-阿里云
镜像管理__控制台使用指南_批量计算-阿里云
CDN加速源站为oss时回源host配置问题__运维技术分享_技术运维问题_CDN-阿里云
如何升级 Redis 版本?__FAQ_云数据库 Redis 版-阿里云
ALIYUN::MEMCACHE::Instance__资源列表_资源编排-阿里云
退款__购买指导_证书服务-阿里云
批量查看消息__队列接口规范_API使用手册_消息服务-阿里云
实时性能页__性能监控_DMS for Redis_用户指南(NoSQL)_数据管理-阿里云
使用阿里云Java应用向导__使用手册_Eclipse 插件-阿里云
Android 收发消息示例__Android 接入示例_MQTT 接入(物联)_消息队列 MQ-阿里云
相关内容
常见错误说明__附录_大数据计算服务-阿里云
发送短信接口__API使用手册_短信服务-阿里云
接口文档__Android_安全组件教程_移动安全-阿里云
运营商错误码(联通)__常见问题_短信服务-阿里云
设置短信模板__使用手册_短信服务-阿里云
OSS 权限问题及排查__常见错误及排除_最佳实践_对象存储 OSS-阿里云
消息通知__操作指南_批量计算-阿里云
设备端快速接入(MQTT)__快速开始_阿里云物联网套件-阿里云
查询API调用流量数据__API管理相关接口_API_API 网关-阿里云
使用STS访问__JavaScript-SDK_SDK 参考_对象存储 OSS-阿里云