820
微信
MySQL 中的数据是否可以放到云数据库 HybridDB 版进行分析__使用管理常见问题_产品相关问题_云数据库 HybridDB-阿里云
向大家提供几种经过验证的向阿里云云数据库 HybridDB 版导入大量数据的方法。
一:使用 COPY 命令导入数据
特点:
1. HybridDB 提供的原生数据导入方法。
2. 需要先把数据从 Mysql 导出成文本文件。
3. 适合少量数据上云,导入过程中数据会经过 HybridDB 的 Master 节点,所以性能不会特别理想。
二: 通过阿里云开源的工具 mysql2pgsql 导入
特点:
1. Mysql 导入 HybridDB DB 到 DB 不落地的导入方案,简单实用。
2. 推荐购买 ECS,和在 ECS 上使用该工具,特别适合从 RDS Mysql/ECS 自建实例导入数据。
3. 该工具已经开源了代码,各位可以定制自己的需求。
4. 该工具写入端也会走 Master 节点,所以性能不会特别理想。
三: 通过 OSS 导入大量数据
该方法的流程如下:
1. 购买和开通阿里云 ECS,OSS 服务。
2. 在 ECS 上使用 ossfs 包挂载购买的 oss 为本地文件系统。
3. 在 ECS 上安装 mysql 二进制RPM。
4. 使用 mysqldump 命令流式获取源库中对应表中的数据,并增量写入到 oss 中。
5. 使用 gp_oss_ext 在 HybridDB 中创建 oss 外部表,并行的将数据导入到 HybridDB 中。
mysqldump 导出举例:
nohup /home/mysql/bin/mysqldump -h192.168.1.1 -P3306 -utest -ptest testdb testtab | sed 's/),(/n/g;s/NULL//g' | split -l 1000000 - /ossdata/testtab/data. 1>/home/test/testtab.out 2>&1 &
上面的举例有几个要点,大家可以根据自己的需求定制
1. 用户可以使用 mysqldump 导出数据,也可以使用 mysql 命令,如果数据量较大,建议使用 --quick 参数,避免内存不足。
2. mysqldump 跟上的 sed 命令是为了格式化导出的数据,以符合 HybridDB 导入的格式规范,大家可以根据需求定制这一项。
3. split 也是一个比较关键的点。它用于定制切割和存放文件的规则。原因有以下两点
3.1 oss 上普通文件有大小限制
3.2 gp_oss_ext 并行导入 oss 上的数据是以文件为单位并发的,推荐在 OSS 上使用虚拟文件夹存放对应一个表的所有数据。
从 OSS 装载数据的特点:
1. 这是一个应对大量数据导入到 HybridDB 的方法,可以轻松从 Mysql 导入上百G,甚至上T的数据到 HybridDB。
2. 不需要很大的缓冲临时空间,数据是流式写入到 OSS 的。
3. 导出和导入时以表为单位进行的,使用者可以并发操作多个表以提高整体的性能。
4. 该方法的性能远好于前两种,导入到云上 HybridDB 规格越大,性能也会越好。
最后更新:2016-11-24 19:10:04
上一篇:
如何获取更多技术信息__常见问题_云数据库 HybridDB-阿里云
下一篇:
如何开通实例__购买续费常见问题_产品相关问题_云数据库 HybridDB-阿里云
安全白皮书__产品白皮书_云数据库 RDS 版-阿里云
更新编排模板__镜像与模板管理_用户指南_容器服务-阿里云
查询访问QPS__资源监控接口_API 手册_CDN-阿里云
获取域名列表__域名管理接口_API文档_云解析-阿里云
院士潘建伟:阿里云与中科院联合发布量子计算云平台,计算能力有望跃升100万倍
常见问题__FAQ_开发人员指南_消息服务-阿里云
机器翻译简介__机器翻译-阿里云
设备接入协议__IoT Hub_产品组件_阿里云物联网套件-阿里云
步骤一:控制台配置__快速上线_Web 应用防火墙-阿里云
通过编排模板创建 WordPress__快速入门_容器服务-阿里云
相关内容
常见错误说明__附录_大数据计算服务-阿里云
发送短信接口__API使用手册_短信服务-阿里云
接口文档__Android_安全组件教程_移动安全-阿里云
运营商错误码(联通)__常见问题_短信服务-阿里云
设置短信模板__使用手册_短信服务-阿里云
OSS 权限问题及排查__常见错误及排除_最佳实践_对象存储 OSS-阿里云
消息通知__操作指南_批量计算-阿里云
设备端快速接入(MQTT)__快速开始_阿里云物联网套件-阿里云
查询API调用流量数据__API管理相关接口_API_API 网关-阿里云
使用STS访问__JavaScript-SDK_SDK 参考_对象存储 OSS-阿里云