閱讀661 返回首頁    go 財經資訊


其他操作__常用命令_基本介紹_大數據計算服務-阿裏雲

Alias功能主要為了滿足在不修改代碼的前提下,在 MapReduce自定義函數(UDF) 代碼中,通過某個固定的資源名讀取不同資源(數據)的需求。命令格式:

  1. ALIAS <alias>=<real>;

用途:為資源創建別名。

示例:

  1. ADD TABLE src_part PARTITION (ds='20121208') AS res_20121208;
  2. ADD TABLE src_part PARTITION (ds='20121209') AS res_20121209;
  3. ALIAS resName=res_20121208;
  4. jar -resources resName -libjars work.jar -classpath ./work.jar com.company.MainClass args ...; // 作業一
  5. ALIAS resName=res_20121209;
  6. jar -resources resName -libjars work.jar -classpath ./work.jar com.company.MainClass args ...; // 作業二

上麵的資源別名“resName” 在兩個作業裏引用到不同的資源表,代碼可以不做修改也能讀取到不同的數據。

Set

命令格式:

  1. set ["<KEY>=<VALUE>"]

說明:用戶可以使用set命令設置MaxCompute 或用戶自定義的係統變量影響MaxCompute 的行為。

目前,MaxCompute 支持的係統變量包括:

  1. --MaxCompute SQL及新版本Mapreduce支持的Set命令
  2. set odps.stage.mapper.mem= --設置每個map worker的內存大小,單位是M,默認值1024M
  3. set odps.stage.reducer.mem= --設置每個reduce worker的內存大小,單位是M,默認值1024M
  4. set odps.stage.joiner.mem= --設置每個join worker的內存大小,單位是M,默認值1024M
  5. set odps.stage.mem =
  6. --設置MaxCompute 指定任務下所有worker的內存大小。優先級低於以上三個set key,單位M,無默認值
  7. set odps.stage.mapper.split.size=
  8. -- 修改每個map worker的輸入數據量,即輸入文件的分片大小,
  9. -- 從而間接控製每個map階段下worker的數量,單位M,默認值256M
  10. set odps.stage.reducer.num= --修改每個reduce階段worker數量,無默認值。
  11. set odps.stage.joiner.num= --修改每個join階段worker數量,無默認值。
  12. set odps.stage.num= --修改MaxCompute 指定任務的所有階段的worker的並發度,優先級低於以上三者,無默認值。

Show Flags

顯示Set設置的參數,命令格式:

  1. show flags;

說明:運行Use Project命令會清除掉set命令設置的配置。

SetProject

命令格式:

  1. setproject ["<KEY>=<VALUE>"];

說明:

  • 用戶可以使用setproject命令設置Project屬性;
  • 當不指定< KEY >=< VALUE > 時,顯示當前Project屬性配置;

Project屬性的詳細說明如下:

屬性名稱 設置權限 屬性描述 取值範圍
odps.table.drop.ignorenonexistent 所有用戶 當刪除不存在的表時,是否報錯。true時不報錯 true(不報錯)/false
odps.security.ip.whitelist ProjectOwner 指定訪問Project的IP白名單 ip列表,逗號分隔
odps.table.lifecycle ProjectOwner optional:創建表時,lifecycle子句為可選,如果用戶不設置 生命周期,則此表永久有效;mandatory:lifecycle子句為必 選;inherit:如果用戶不指定生命周期,該表的生命周期為 odps.table.lifecycle.value的值; optional /mandatory/inherit
odps.table.lifecycle.value ProjectOwner 默認的生命周期值 1 ~ 37231(默認)
odps.instance.remain.days ProjectOwner Instance信息保留時間 3 ~ 30
odps.function.strictmode ProjectOwner 內置函數遇到髒數據時,返回NULL(false),或者拋異常(true) true/false
READ_TABLE_MAX_ROW ProjectOwner Select語句返回給客戶端的數據條數 1~10000

計量預估(Cost SQL命令)

命令格式:

  1. cost sql <SQL Sentence>;

用途:預估出一條sql的計量信息,包含輸入數據的大小,UDF個數以及SQL複雜等級。需要注意的是,該信息不能夠作為實際計費標準,僅具有參考意義。

示例:

  1. odps@ $odps_project >cost sql select distinct project_name, user_name from meta.m_security_users distribute by project_name sort by project_name;
  2. ID = 20150715113033121gmsbjxl1
  3. Input:65727592 Bytes
  4. UDF:0
  5. Complexity:1.0

最後更新:2016-11-23 17:16:04

  上一篇:go Tunnel命令操作__常用命令_基本介紹_大數據計算服務-阿裏雲
  下一篇:go 限製描述__DataHub實時數據通道_大數據計算服務-阿裏雲