133
微信
OSS 参考使用说明__开发准备_开发人员指南_E-MapReduce-阿里云
OSS URI
在使用 E-MapReduce 时,用户将会使用两种 OSS URI,分别是:
native URI: oss://[accessKeyId:accessKeySecret@]bucket[.endpoint]/object/path
用户在作业中指定输入输出数据源时使用这种 URI,可以类比 hdfs://。用户操作 OSS 数据时,可以将 accessKeyId,accessKeySecret 以及 endpoint 配置到 Configuration 中,也可以在 URI 中直接指定 accessKeyId,accessKeySecret 以及 endpoint。
ref URI: ossref://bucket/object/path
只在 E-MapReduce 作业配置时有效,用来指定作业运行需要的资源。例如以下作业配置示例:
我们把 oss 与 ossref 这样的前缀称为 scheme。在使用过程中,需要特别注意 URI 中 scheme 的不同。
注意事项
在支持向 OSS 写数据时,E-MapReduce 使用 OSS 的 multipart 分片上传方式。这里需要提醒的是,当作业异常中断后,OSS 中会残留作业已经生产的部分数据,需要您手动删掉。这里的行为和作业输出到 HDFS 是一致的,作业异常中断后,HDFS 也会残留数据,也需要手动删掉。但有一个区别,OSS 对使用 multipart 上传的文件,它是先放在碎片管理中,所以您不仅要删除 OSS 文件管理中的输出目录残留文件,还需要在 OSS 的碎片管理中清理一次,否则会产生数据存储费用。
最后更新:2016-11-23 16:04:15
上一篇:
开发准备___开发人员指南_E-MapReduce-阿里云
下一篇:
示例项目使用说明__开发准备_开发人员指南_E-MapReduce-阿里云
SMTP之Ruby调用示例__SMTP接口说明_邮件推送-阿里云
邮件推送__开发人员指南_消息服务-阿里云
手动扩展系统盘__扩容磁盘概览_磁盘_用户指南_云服务器 ECS-阿里云
修改集群名称__集群_API参考_E-MapReduce-阿里云
实例内不同数据库之间的数据迁移__最佳实践_数据传输-阿里云
设备认证相关问题__产品常见问题_阿里云物联网套件-阿里云
日志查询__常见问题_日志服务-阿里云
格力回应造车传闻,阿里云被责令整改
高防IP结合WAF___常见接入问题_Web 应用防火墙-阿里云
ALIYUN::ROS::WaitConditionHandle__资源列表_资源编排-阿里云
相关内容
常见错误说明__附录_大数据计算服务-阿里云
发送短信接口__API使用手册_短信服务-阿里云
接口文档__Android_安全组件教程_移动安全-阿里云
运营商错误码(联通)__常见问题_短信服务-阿里云
设置短信模板__使用手册_短信服务-阿里云
OSS 权限问题及排查__常见错误及排除_最佳实践_对象存储 OSS-阿里云
消息通知__操作指南_批量计算-阿里云
设备端快速接入(MQTT)__快速开始_阿里云物联网套件-阿里云
查询API调用流量数据__API管理相关接口_API_API 网关-阿里云
使用STS访问__JavaScript-SDK_SDK 参考_对象存储 OSS-阿里云