閱讀769 返回首頁    go 阿裏雲 go 技術社區[雲棲]


阿裏雲創建E-MapReduce 3 創建作業

要運行一個計算任務,首先需要定義一個作業,其步驟如下:

1.登錄阿裏雲 E-MapReduce 控製台作業頁麵

2.選擇地域(Region),則作業將會創建在對應的地域內。

3.單擊該頁右上角的創建作業,進入創建作業頁麵,如下圖所示:


screenshot

4.填寫作業名稱。

5.選擇作業類型。

6.填寫作業的應用參數。應用參數需要完整填寫該作業運行的 jar 包、作業的數據輸入輸出地址以及一些命令行參數,也就是將用戶在命令行的所有參數填寫在這裏。如果有使用到 OSS 的路徑,可以單擊下方的“選擇 OSS 路徑”選擇 OSS 資源路徑。關於各作業類型的參數配置,請參見用戶指南中的作業。

7.實際執行命令。這裏會顯示作業在 ECS 上實際被執行的命令。用戶如果把這個命令直接複製下來,就能夠在 E-MapReduce 集群的命令行環境中直接運行。

8.選擇執行失敗後策略。暫停當前執行計劃會在這個作業失敗後,暫停當前整個執行計劃,等待用戶處理。而繼續執行下一個作業在這個作業失敗以後,會忽略這個錯誤繼續執行後一個作業。

9.單擊確定完成創建。

作業示例

這是一個 Spark 類型的作業,應用參數中設置了相關的參數,輸入輸出路徑等。

注意:本作業僅僅示例,不能實際運行。


screenshot

oss 與 ossref

oss:// 的前綴代表數據路徑指向一個 OSS 路徑,當要讀寫該數據的時候,這個指明了操作的路徑,與 hdfs:// 類似。

ossref:// 同樣是指向一個 OSS 的路徑,不同的是它會將對應的代碼資源下載到本地,然後將命令行中的路徑替換為本地路徑。它是用於更方便地運行一些本地代碼,而不需要登錄到機器上去上傳代碼和依賴的資源包。

上麵的例子中, ossref://xxxxxx/xxx.jar 這個參數代表作業資源的jar,這個jar存放在OSS上,在運行的時候,E-MapReduce會自動下載到集群中運行。而跟在jar後麵的2個 oss://xxxx 以及另外2個值則是作為參數出現,他們會被作為參數傳遞給jar中的主類來處理。

注意: ossref 不可以用來下載過大的數據資源,否則會導致集群作業的失敗。

最後更新:2017-08-31 23:32:58

  上一篇:go  Gartner存儲魔力象限前四,阿裏雲如何成為“領頭羊”?
  下一篇:go  阿裏雲創建E-MapReduce 1 快速開始