709
魔兽
Spark 作业配置__作业_用户指南_E-MapReduce-阿里云
单击该页右上角的创建作业,进入创建作业页面。
填写作业名称。
选择 Spark 作业类型,表示创建的作业是一个 Spark 作业。Spark 作业在 E-MapReduce 后台使用以下的方式提交:
spark-submit [options] --class [MainClass] xxx.jar args
在应用参数选项框中填写提交该 Spark 作业需要的命令行参数。请注意,应用参数框中只需要填写“spark-submit”之后的参数即可。以下分别示例如何填写创建 Spark 作业和 pyspark 作业的参数。
创建 Spark 作业
新建一个 Spark WordCount 作业。
作业名称: Wordcount
类型:选择 Spark
应用参数:
在命令行下完整的提交命令是:
spark-submit --master yarn-client --driver-memory 7G --executor-memory 5G --executor-cores 1 --num-executors 32 --class com.aliyun.emr.checklist.benchmark.SparkWordCount emr-checklist_2.10-0.1.0.jar oss://emr/checklist/data/wc oss://emr/checklist/data/wc-counts 32
在 E-MapReduce 作业的应用参数框中只需要填写:
--master yarn-client --driver-memory 7G --executor-memory 5G --executor-cores 1 --num-executors 32 --class com.aliyun.emr.checklist.benchmark.SparkWordCount ossref://emr/checklist/jars/emr-checklist_2.10-0.1.0.jar oss://emr/checklist/data/wc oss://emr/checklist/data/wc-counts 32
需要注意的是:作业 Jar 包保存在 OSS 中,引用这个 Jar 包的方式是 ossref://emr/checklist/jars/emr-checklist_2.10-0.1.0.jar。您可以单击选择 OSS 路径,从 OSS 中进行浏览和选择,系统会自动补齐 OSS 上 Spark 脚本的绝对路径。请务必将默认的“oss”协议切换成“ossref”协议。
创建 pyspark 作业
E-MapReduce 除了支持 Scala 或者 Java 类型作业外,还支持 python 类型 Spark 作业。以下新建一个 python 脚本的 Spark Kmeans 作业。
作业名称:Python-Kmeans
类型:Spark
应用参数:
--master yarn-client --driver-memory 7g --num-executors 10 --executor-memory 5g --executor-cores 1 ossref://emr/checklist/python/kmeans.py oss://emr/checklist/data/kddb 5 32
支持 Python 脚本资源的引用,同样使用“ossref”协议。
pyspark 目前不支持在线安装 Python 工具包。
选择执行失败后策略。
单击确定,Spark 作业即定义完成。
最后更新:2016-12-01 20:49:11
上一篇:
Pig 作业配置__作业_用户指南_E-MapReduce-阿里云
下一篇:
Spark SQL 作业配置__作业_用户指南_E-MapReduce-阿里云
SDK API介绍__Android SDK手册_App SDK 手册_移动推送-阿里云
修改弹性公网IP属性__弹性公网IP相关接口_API参考_专有网络 VPC-阿里云
数据迁移__功能特性_产品简介_数据传输-阿里云
5寸 聚碳酸酯机身+2.5D悬浮玻璃 阿里云系统,价格最低
ARMS Open API 说明__API 参考_业务实时监控服务 ARMS-阿里云
查询数据库__数据库管理_开放API_分布式关系型数据库 DRDS-阿里云
配置 IDEA 开发环境__开发工具准备_开发者指南_企业级分布式应用服务 EDAS-阿里云
云服务器 ECS Linux创建实例
远程连接服务器For Windows__服务配置_远程桌面_Windows操作运维问题_云服务器 ECS-阿里云
客户端说明__客户端连接实例_快速入门_云数据库 Memcache 版-阿里云
相关内容
常见错误说明__附录_大数据计算服务-阿里云
发送短信接口__API使用手册_短信服务-阿里云
接口文档__Android_安全组件教程_移动安全-阿里云
运营商错误码(联通)__常见问题_短信服务-阿里云
设置短信模板__使用手册_短信服务-阿里云
OSS 权限问题及排查__常见错误及排除_最佳实践_对象存储 OSS-阿里云
消息通知__操作指南_批量计算-阿里云
设备端快速接入(MQTT)__快速开始_阿里云物联网套件-阿里云
查询API调用流量数据__API管理相关接口_API_API 网关-阿里云
使用STS访问__JavaScript-SDK_SDK 参考_对象存储 OSS-阿里云