709
魔獸
Spark 作業配置__作業_用戶指南_E-MapReduce-阿裏雲
單擊該頁右上角的創建作業,進入創建作業頁麵。
填寫作業名稱。
選擇 Spark 作業類型,表示創建的作業是一個 Spark 作業。Spark 作業在 E-MapReduce 後台使用以下的方式提交:
spark-submit [options] --class [MainClass] xxx.jar args
在應用參數選項框中填寫提交該 Spark 作業需要的命令行參數。請注意,應用參數框中隻需要填寫“spark-submit”之後的參數即可。以下分別示例如何填寫創建 Spark 作業和 pyspark 作業的參數。
創建 Spark 作業
新建一個 Spark WordCount 作業。
作業名稱: Wordcount
類型:選擇 Spark
應用參數:
在命令行下完整的提交命令是:
spark-submit --master yarn-client --driver-memory 7G --executor-memory 5G --executor-cores 1 --num-executors 32 --class com.aliyun.emr.checklist.benchmark.SparkWordCount emr-checklist_2.10-0.1.0.jar oss://emr/checklist/data/wc oss://emr/checklist/data/wc-counts 32
在 E-MapReduce 作業的應用參數框中隻需要填寫:
--master yarn-client --driver-memory 7G --executor-memory 5G --executor-cores 1 --num-executors 32 --class com.aliyun.emr.checklist.benchmark.SparkWordCount ossref://emr/checklist/jars/emr-checklist_2.10-0.1.0.jar oss://emr/checklist/data/wc oss://emr/checklist/data/wc-counts 32
需要注意的是:作業 Jar 包保存在 OSS 中,引用這個 Jar 包的方式是 ossref://emr/checklist/jars/emr-checklist_2.10-0.1.0.jar。您可以單擊選擇 OSS 路徑,從 OSS 中進行瀏覽和選擇,係統會自動補齊 OSS 上 Spark 腳本的絕對路徑。請務必將默認的“oss”協議切換成“ossref”協議。
創建 pyspark 作業
E-MapReduce 除了支持 Scala 或者 Java 類型作業外,還支持 python 類型 Spark 作業。以下新建一個 python 腳本的 Spark Kmeans 作業。
作業名稱:Python-Kmeans
類型:Spark
應用參數:
--master yarn-client --driver-memory 7g --num-executors 10 --executor-memory 5g --executor-cores 1 ossref://emr/checklist/python/kmeans.py oss://emr/checklist/data/kddb 5 32
支持 Python 腳本資源的引用,同樣使用“ossref”協議。
pyspark 目前不支持在線安裝 Python 工具包。
選擇執行失敗後策略。
單擊確定,Spark 作業即定義完成。
最後更新:2016-12-01 20:49:11
上一篇:
Pig 作業配置__作業_用戶指南_E-MapReduce-阿裏雲
下一篇:
Spark SQL 作業配置__作業_用戶指南_E-MapReduce-阿裏雲
SDK API介紹__Android SDK手冊_App SDK 手冊_移動推送-阿裏雲
修改彈性公網IP屬性__彈性公網IP相關接口_API參考_專有網絡 VPC-阿裏雲
數據遷移__功能特性_產品簡介_數據傳輸-阿裏雲
5寸 聚碳酸酯機身+2.5D懸浮玻璃 阿裏雲係統,價格最低
ARMS Open API 說明__API 參考_業務實時監控服務 ARMS-阿裏雲
查詢數據庫__數據庫管理_開放API_分布式關係型數據庫 DRDS-阿裏雲
配置 IDEA 開發環境__開發工具準備_開發者指南_企業級分布式應用服務 EDAS-阿裏雲
雲服務器 ECS Linux創建實例
遠程連接服務器For Windows__服務配置_遠程桌麵_Windows操作運維問題_雲服務器 ECS-阿裏雲
客戶端說明__客戶端連接實例_快速入門_雲數據庫 Memcache 版-阿裏雲
相關內容
常見錯誤說明__附錄_大數據計算服務-阿裏雲
發送短信接口__API使用手冊_短信服務-阿裏雲
接口文檔__Android_安全組件教程_移動安全-阿裏雲
運營商錯誤碼(聯通)__常見問題_短信服務-阿裏雲
設置短信模板__使用手冊_短信服務-阿裏雲
OSS 權限問題及排查__常見錯誤及排除_最佳實踐_對象存儲 OSS-阿裏雲
消息通知__操作指南_批量計算-阿裏雲
設備端快速接入(MQTT)__快速開始_阿裏雲物聯網套件-阿裏雲
查詢API調用流量數據__API管理相關接口_API_API 網關-阿裏雲
使用STS訪問__JavaScript-SDK_SDK 參考_對象存儲 OSS-阿裏雲