阅读853 返回首页    go 微信


E-MapReduce 快速开始__创建 E-MapReduce_快速入门_E-MapReduce-阿里云

注意:请确认您已经完成了必选准备工作

通过本教程,用户能够基本了解E-MapReduce中集群,作业和执行计划的作用和使用方法。能够创建一个Spark Pi的作业在集群上运行成功,并最后在控制台页面上看到圆周率Pi的近似计算结果。

  1. 创建集群
    1. 在控制台左侧选择集群,并点击右上创建集群
    2. 软件配置
      1. 选择EMR-2.1.1产品版本
      2. 使用默认软件配置
    3. 硬件配置
      1. 选择按量付费
      2. 若没有安全组,打开新建,并填写安全组名称
      3. 选择 Master 4核8G
      4. 选择 Core 4核8G, 一台
      5. 其他保持默认
    4. 基础配置
      1. 填写集群名称
      2. 选择日志路径保存作业日志,务必开启在集群对应的地域创建OSS的Bucket
      3. 填写密码
    5. 创建集群
  2. 创建作业
    1. 在控制台左侧选择作业,并点击右上创建作业
    2. 填写作业名称
    3. 选择Spark类型
    4. 参数填写,使用如下
      1. --class org.apache.spark.examples.SparkPi --master yarn-client --driver-memory 512m --num-executors 1 --executor-memory 1g --executor-cores 2 /opt/apps/spark-1.6.1-bin-hadoop2.7/lib/spark-examples-1.6.1-hadoop2.7.2.jar 10
    5. 其他保持默认,创建作业
  3. 创建执行计划
    1. 确认之前创建的集群已经创建成功以后,在列表上的状态显示为空闲
    2. 在控制台左侧选择执行计划,并点击右上创建执行计划
    3. 创建时选择已有集群,并选择之前创建集群进行关联
    4. 将之前创建的作业,加入到运行队列中
    5. 填写执行计划名称
    6. 默认手动执行
    7. 创建执行计划
  4. 运行执行计划
    1. 在执行计划列表页面,点击立即运行
  5. 查看作业日志并确认结果
    1. 点击管理,进入管理页面,在下方查看运行记录
    2. 点击运行记录的右侧,查看作业列表
    3. 点击stdout能够查看到,Pi的近似计算结果,3.14xxxx

最后更新:2016-11-23 16:04:17

  上一篇:go 准备工作__快速入门_E-MapReduce-阿里云
  下一篇:go 创建执行计划__创建 E-MapReduce_快速入门_E-MapReduce-阿里云