636
阿裏雲
Oozie 使用說明__開源組件介紹_用戶指南_E-MapReduce-阿裏雲
版本信息
阿裏雲 E-MapReduce 在 2.0.0 及之後的版本中提供了對 Oozie 的支持,如果需要在集群中使用 Oozie,請確認集群的版本不低於 2.0.0。
準備工作
在集群建立出來之後,需要打通 ssh 隧道,詳細步驟請參考:https://help.aliyun.com/document_detail/28187.html
這裏以 MAC 環境為例,使用 Chrome 瀏覽器實現端口轉發(假設集群 master 節點公網 IP 為 xx.xx.xx.xx
):
登錄到 master 節點。
ssh root@xx.xx.xx.xx
輸入密碼。
查看本機的 id_rsa.pub 內容(注意在本機執行,不要在遠程的 master 節點上執行)。
cat ~/.ssh/id_rsa.pub
將本機的 id_rsa.pub 內容寫入到遠程 master 節點的 ~/.ssh/authorized_keys 中(在遠端 master 節點上執行)。
mkdir ~/.ssh/
vim ~/.ssh/authorized_keys
然後將步驟 2 中看到的內容粘貼進來,現在應該可以直接使用 ssh root@xx.xx.xx.xx 免密登錄 master 節點了。
在本機執行以下命令進行端口轉發。
ssh -i ~/.ssh/id_rsa -ND 8157 root@xx.xx.xx.xx
- 啟動 Chrome(在本機新開 terminal 執行)。
/Applications/Google Chrome.app/Contents/MacOS/Google Chrome --proxy-server="socks5://localhost:8157" --host-resolver-rules="MAP * 0.0.0.0 , EXCLUDE localhost" --user-data-dir=/tmp
訪問 Oozie UI 頁麵
在進行端口轉發的 Chrome 瀏覽器中訪問:xx.xx.xx.xx:11000/oozie
,localhost:11000/oozie
或者內網 ip:11000/oozie
。
提交workflow作業
運行 Oozie 需要先安裝 Oozie 的sharelib:https://oozie.apache.org/docs/4.2.0/WorkflowFunctionalSpec.html#ShareLib
在 E-MapReduce 集群中,默認給 Oozie 用戶安裝了 sharelib,即如果使用 Oozie 用戶來提交 workflow 作業,則不需要再進行 sharelib 的安裝。
由於開啟 HA的集群和沒有開啟 HA 的集群,訪問 NameNode 和 ResourceManager 的方式不同,在提交 oozie workflow job 的時候,job.properties 文件中需要指定不同的 NameNode 和 JobTracker (ResourceManager)。具體如下:
非 HA 集群
nameNode=hdfs://localhost:9000
jobTracker=localhost:8032
HA 集群
nameNode=hdfs://emr-cluster
jobTracker=rm1,rm2
下麵操作示例中,已經針對是否是 HA 集群配置好了,即樣例代碼不需要任何修改即可以直接運行。關於 workflow 文件的具體格式,請參考 Oozie 官方文檔:https://oozie.apache.org/docs/4.2.0/。
在非 HA 集群上提交 workflow 作業
登錄集群的主 master 節點。
ssh root@master公網Ip
下載示例代碼。
[root@emr-header-1 ~]# su oozie
[oozie@emr-header-1 root]$ cd /tmp
[oozie@emr-header-1 tmp]$ wget https://emr-sample-projects.oss-cn-hangzhou.aliyuncs.com/oozie-examples/oozie-examples.zip
[oozie@emr-header-1 tmp]$ unzip oozie-examples.zip
將 Oozie workflow 代碼同步到 hdfs 上。
[oozie@emr-header-1 tmp]$ hadoop fs -copyFromLocal examples/ /user/oozie/examples
提交 Oozie workflow 樣例作業。
[oozie@emr-header-1 tmp]$ $OOZIE_HOME/bin/oozie job -config examples/apps/map-reduce/job.properties -run
執行成功之後,會返回一個 jobId,類似:
job: 0000000-160627195651086-oozie-oozi-W
訪問 Oozie UI 頁麵,可以看到剛剛提交的 Oozie workflow job。
在 HA 集群上提交 workflow 作業
登錄 HA 集群的主 master 節點。
ssh root@主master公網Ip
可以通過是否能訪問 Oozie UI 來判斷哪個 master 節點是當前的主 master 節點, Oozie server 服務默認是啟動在主 master 節點
xx.xx.xx.xx:11000/oozie
。下載 HA 集群的示例代碼。
[root@emr-header-1 ~]# su oozie
[oozie@emr-header-1 root]$ cd /tmp
[oozie@emr-header-1 tmp]$ wget https://emr-sample-projects.oss-cn-hangzhou.aliyuncs.com/oozie-examples/oozie-examples-ha.zip
[oozie@emr-header-1 tmp]$ unzip oozie-examples-ha.zip
將 Oozie workflow 代碼同步到 hdfs 上。
[oozie@emr-header-1 tmp]$ hadoop fs -copyFromLocal examples/ /user/oozie/examples
提交 Oozie workflow 樣例作業。
[oozie@emr-header-1 tmp]$ $OOZIE_HOME/bin/oozie job -config examples/apps/map-reduce/job.properties -run
執行成功之後,會返回一個 jobId,類似:
job: 0000000-160627195651086-oozie-oozi-W
訪問 Oozie UI 頁麵,可以看到剛剛提交的 Oozie workflow job。
最後更新:2016-11-23 16:04:13
上一篇:
Hue 使用說明__開源組件介紹_用戶指南_E-MapReduce-阿裏雲
下一篇:
Presto 使用說明__開源組件介紹_用戶指南_E-MapReduce-阿裏雲
刪除角色__賬號管理類 API_Open API 參考_企業級分布式應用服務 EDAS-阿裏雲
數據模型__公共資源說明_API-Reference_日誌服務-阿裏雲
查詢媒體-使用OSS文件地址__媒體接口_API使用手冊_視頻點播-阿裏雲
步驟一:控製台配置__快速上線_Web 應用防火牆-阿裏雲
IpAddressSetType__數據類型_API 參考_雲服務器 ECS-阿裏雲
阿裏雲總裁胡曉明:當製造業和雲計算結合,智能製造才真正開始
變更配置__購買指南_雲數據庫 RDS 版-阿裏雲
鏡像產品製作__商品接入_服務商_雲市場-阿裏雲
LiveChannel簡介__關於LiveChannel的操作_API 參考_對象存儲 OSS-阿裏雲
ErrorCodeSample__數據類型_API_API 網關-阿裏雲
相關內容
常見錯誤說明__附錄_大數據計算服務-阿裏雲
發送短信接口__API使用手冊_短信服務-阿裏雲
接口文檔__Android_安全組件教程_移動安全-阿裏雲
運營商錯誤碼(聯通)__常見問題_短信服務-阿裏雲
設置短信模板__使用手冊_短信服務-阿裏雲
OSS 權限問題及排查__常見錯誤及排除_最佳實踐_對象存儲 OSS-阿裏雲
消息通知__操作指南_批量計算-阿裏雲
設備端快速接入(MQTT)__快速開始_阿裏雲物聯網套件-阿裏雲
查詢API調用流量數據__API管理相關接口_API_API 網關-阿裏雲
使用STS訪問__JavaScript-SDK_SDK 參考_對象存儲 OSS-阿裏雲