667
阿里云
理解批量计算__产品简介_批量计算-阿里云
1. 基础架构
BatchCompute整体架构,包括:
BatchCompute入口
批量计算服务提供基于HTTP的API,在API之上我们还封装了一些工具,比如SDK,命令行工具,控制台等。用户可以使用这些工具向BatchCompute提交作业,查询作业运行状态,并管理作业生命周期(比如停止已提交的作业,释放已完成的作业等)。
运行环境
BatchCompute通过虚拟化技术构建沙箱,并在其中运行用户程序,确保用户环境和用户数据的安全性。用户可以自行定制其虚拟机镜像。
-
OSS 有完善的用户管理和安全机制。BatchCompute使用 OSS 作为持久化存储。用户的程序、自定义Docker镜像、输入输出数据都存储在 OSS 中。
2. 功能介绍
(1) 提交作业
用户使用工具(如SDK,命令行工具等)向 BatchCompute 提交作业,BatchCompute 使用用户指定的镜像(如:ubuntu)启动虚拟机(VM), 在虚拟机中运行用户程序, 运行完成后释放虚拟机(VM)。
作业描述
用户需要提交一个作业(Job)描述JSON文件到批量计算服务,该JSON文件中详细描述了需要执行那些程序(可以多个程序),运行哪些程序需要启动多少台机器,机器的规格(内存和CPU等),运行日志打印到哪里,完成后结果输出到哪里等。
一个作业(Job)包含多个任务(Task), 按照你指定DAG描述的顺序执行。
每个任务定义了使用哪个镜像,使用什么实例规格,运行哪个程序,需要多少台机器运行,还有结果存储在哪里等。
(2) 管理我的作业
您可以使用工具(控制台,命令行工具等),查看我提交的作业,可以停止,重启,或删除作业。 查看各个任务的情况,各个实例(VM实例)的情况和日志。下图是控制台的作业管理界面:
(3) 使用集群
由于每次运行程序前需要启动虚拟机,会占用一定的时间(一般几分钟左右),遇到忙时有可能申请不到资源(虚拟机被其他客户使用了),您提交作业后可能需要等待一段时间才能运行。
如果您想要提高运行效率,可以先创建好集群,指定需要的虚拟机数量(比如:5台)和镜像ID,BatchCompute会为您分配好机器并启动,这些机器会一直处于运行状态,一旦您提交作业上来,就可以直接运行,效率较高。
最后更新:2016-11-23 16:04:15
上一篇:
什么是批量计算__产品简介_批量计算-阿里云
下一篇:
使用场景__产品简介_批量计算-阿里云
服务区域__使用手册_媒体转码-阿里云
syslog日志__常见日志格式_用户指南_日志服务-阿里云
DeleteBucketLifecycle__关于Bucket的操作_API 参考_对象存储 OSS-阿里云
虚拟主机访问 ASP 页面显示 An error occurred on the server when processing the URL___安全问题_技术分享_云虚机主机-阿里云
获取域名信息__域名管理接口_API文档_云解析-阿里云
域名实名认证问题FAQ__域名资料提交_管理操作_域名-阿里云
业务数据分析__快速开始_移动数据分析-阿里云
专有网络中跨可用区部署资源__最佳实践_用户指南_专有网络 VPC-阿里云
ListShards__日志库相关接口_API-Reference_日志服务-阿里云
预检查失败修复__数据迁移_用户指南_数据传输-阿里云
相关内容
常见错误说明__附录_大数据计算服务-阿里云
发送短信接口__API使用手册_短信服务-阿里云
接口文档__Android_安全组件教程_移动安全-阿里云
运营商错误码(联通)__常见问题_短信服务-阿里云
设置短信模板__使用手册_短信服务-阿里云
OSS 权限问题及排查__常见错误及排除_最佳实践_对象存储 OSS-阿里云
消息通知__操作指南_批量计算-阿里云
设备端快速接入(MQTT)__快速开始_阿里云物联网套件-阿里云
查询API调用流量数据__API管理相关接口_API_API 网关-阿里云
使用STS访问__JavaScript-SDK_SDK 参考_对象存储 OSS-阿里云