661
人物
其他操作__常用命令_基本介绍_大数据计算服务-阿里云
Alias功能主要为了满足在不修改代码的前提下,在 MapReduce 或 自定义函数(UDF) 代码中,通过某个固定的资源名读取不同资源(数据)的需求。命令格式:
ALIAS <alias>=<real>;
用途:为资源创建别名。
示例:
ADD TABLE src_part PARTITION (ds='20121208') AS res_20121208;
ADD TABLE src_part PARTITION (ds='20121209') AS res_20121209;
ALIAS resName=res_20121208;
jar -resources resName -libjars work.jar -classpath ./work.jar com.company.MainClass args ...; // 作业一
ALIAS resName=res_20121209;
jar -resources resName -libjars work.jar -classpath ./work.jar com.company.MainClass args ...; // 作业二
上面的资源别名“resName” 在两个作业里引用到不同的资源表,代码可以不做修改也能读取到不同的数据。
Set
命令格式:
set ["<KEY>=<VALUE>"]
说明:用户可以使用set命令设置MaxCompute 或用户自定义的系统变量影响MaxCompute 的行为。
目前,MaxCompute 支持的系统变量包括:
--MaxCompute SQL及新版本Mapreduce支持的Set命令
set odps.stage.mapper.mem= --设置每个map worker的内存大小,单位是M,默认值1024M
set odps.stage.reducer.mem= --设置每个reduce worker的内存大小,单位是M,默认值1024M
set odps.stage.joiner.mem= --设置每个join worker的内存大小,单位是M,默认值1024M
set odps.stage.mem =
--设置MaxCompute 指定任务下所有worker的内存大小。优先级低于以上三个set key,单位M,无默认值
set odps.stage.mapper.split.size=
-- 修改每个map worker的输入数据量,即输入文件的分片大小,
-- 从而间接控制每个map阶段下worker的数量,单位M,默认值256M
set odps.stage.reducer.num= --修改每个reduce阶段worker数量,无默认值。
set odps.stage.joiner.num= --修改每个join阶段worker数量,无默认值。
set odps.stage.num= --修改MaxCompute 指定任务的所有阶段的worker的并发度,优先级低于以上三者,无默认值。
Show Flags
显示Set设置的参数,命令格式:
show flags;
说明:运行Use Project命令会清除掉set命令设置的配置。
SetProject
命令格式:
setproject ["<KEY>=<VALUE>"];
说明:
- 用户可以使用setproject命令设置Project属性;
- 当不指定< KEY >=< VALUE > 时,显示当前Project属性配置;
Project属性的详细说明如下:
属性名称 | 设置权限 | 属性描述 | 取值范围 |
---|---|---|---|
odps.table.drop.ignorenonexistent | 所有用户 | 当删除不存在的表时,是否报错。true时不报错 | true(不报错)/false |
odps.security.ip.whitelist | ProjectOwner | 指定访问Project的IP白名单 | ip列表,逗号分隔 |
odps.table.lifecycle | ProjectOwner | optional:创建表时,lifecycle子句为可选,如果用户不设置 生命周期,则此表永久有效;mandatory:lifecycle子句为必 选;inherit:如果用户不指定生命周期,该表的生命周期为 odps.table.lifecycle.value的值; | optional /mandatory/inherit |
odps.table.lifecycle.value | ProjectOwner | 默认的生命周期值 | 1 ~ 37231(默认) |
odps.instance.remain.days | ProjectOwner | Instance信息保留时间 | 3 ~ 30 |
odps.function.strictmode | ProjectOwner | 内置函数遇到脏数据时,返回NULL(false),或者抛异常(true) | true/false |
READ_TABLE_MAX_ROW | ProjectOwner | Select语句返回给客户端的数据条数 | 1~10000 |
计量预估(Cost SQL命令)
命令格式:
cost sql <SQL Sentence>;
用途:预估出一条sql的计量信息,包含输入数据的大小,UDF个数以及SQL复杂等级。需要注意的是,该信息不能够作为实际计费标准,仅具有参考意义。
示例:
odps@ $odps_project >cost sql select distinct project_name, user_name from meta.m_security_users distribute by project_name sort by project_name;
ID = 20150715113033121gmsbjxl1
Input:65727592 Bytes
UDF:0
Complexity:1.0
最后更新:2016-11-23 17:16:04
上一篇:
Tunnel命令操作__常用命令_基本介绍_大数据计算服务-阿里云
下一篇:
限制描述__DataHub实时数据通道_大数据计算服务-阿里云
迁移 RDS 数据到其他实例__数据迁移_用户指南_云数据库 RDS 版-阿里云
查询水印模板__水印模板接口_API使用手册_媒体转码-阿里云
注册账户__设置准备_用户指南_负载均衡-阿里云
GroupDesc__数据类型_API文档_批量计算-阿里云
创建表格存储实例(可选)__用户指南_推荐引擎-阿里云
云监控ECS监控插件安装方法__技术分享_技术运维问题_云监控-阿里云
获取主题属性__主题使用帮助_控制台使用帮助_消息服务-阿里云
项目空间操作__常用命令_基本介绍_大数据计算服务-阿里云
安全服务__快速入门(开放API)_API 网关-阿里云
QueueMessage__基本概念_API使用手册_消息服务-阿里云
相关内容
常见错误说明__附录_大数据计算服务-阿里云
发送短信接口__API使用手册_短信服务-阿里云
接口文档__Android_安全组件教程_移动安全-阿里云
运营商错误码(联通)__常见问题_短信服务-阿里云
设置短信模板__使用手册_短信服务-阿里云
OSS 权限问题及排查__常见错误及排除_最佳实践_对象存储 OSS-阿里云
消息通知__操作指南_批量计算-阿里云
设备端快速接入(MQTT)__快速开始_阿里云物联网套件-阿里云
查询API调用流量数据__API管理相关接口_API_API 网关-阿里云
使用STS访问__JavaScript-SDK_SDK 参考_对象存储 OSS-阿里云