表__基本概念_基本介绍_大数据计算服务-阿里云
表是 MaxCompute 的数据存储单元。它在逻辑上也是由行和列组成的二维结构,每行代表一条记录,每列表示相同数据类型的一个字段,一条记录可以包含一个或多个列,各个列的名称和类型构成这张表的 Schema。
MaxCompute的表格分两种类型:外部表及内部表。
对于内部表,所有的数据都被存储在MaxCompute中。表中的列可以是 MaxCompute 支持的任意种数据类型(Bigint,Double,String,Boolean,Datetime)。MaxCompute 中的各种不同类型计算任务的操作对象(输入、输出)都是表。用户可以创建表,删除表以及向表中导入数据。
对于外部表,MaxCompute并不真正持有数据,表格的数据可以存放在OSS中。MaxCompute仅会记录表格的Meta信息。用户可以通过MaxCompute的外部表机制处理OSS上的非结构化数据,例如:视频、音频、基因、气象、地理信息等。处理流程包括:
- 将数据上传至OSS;
- 在RAM产品中授予MaxCompute服务读取OSS数据权限;
- 自定义Extractor:用于读取OSS上的特殊格式数据。目前,MaxCompute默认提供CSV格式的Extractor,并提供视频格式数据读取的代码样例;
- 创建外部表;
- 执行SQL作业分析数据;
注意:
- 目前MaxCompute仅支持读取外部表数据,即读取OSS数据,不支持向外部表写入数据;
- 更多文章介绍请参考云栖社区文章之MaxCompute上如何处理非结构化数据;
最后更新:2016-10-26 14:17:46
上一篇:
项目空间__基本概念_基本介绍_大数据计算服务-阿里云
下一篇:
数据类型__基本概念_基本介绍_大数据计算服务-阿里云
DML语句__SQL_大数据计算服务-阿里云
创建OceanBase实例__快速入门_云数据库 OceanBase-阿里云
OpenIdConnectConfig__数据类型_API_API 网关-阿里云
创建存储空间__快速入门_对象存储 OSS-阿里云
发送短信接口__API使用手册_短信服务-阿里云
删除账号__账号管理_API 参考_云数据库 RDS 版-阿里云
业务限制__附录_RAM API文档_访问控制-阿里云
管理镜像共享__镜像相关接口_API 参考_云服务器 ECS-阿里云
CDN__操作事件(Event)样例_用户指南_操作审计-阿里云
通用图像分析服务简介__通用图像分析服务_人工智能图像类-阿里云
相关内容
常见错误说明__附录_大数据计算服务-阿里云
发送短信接口__API使用手册_短信服务-阿里云
接口文档__Android_安全组件教程_移动安全-阿里云
运营商错误码(联通)__常见问题_短信服务-阿里云
设置短信模板__使用手册_短信服务-阿里云
OSS 权限问题及排查__常见错误及排除_最佳实践_对象存储 OSS-阿里云
消息通知__操作指南_批量计算-阿里云
设备端快速接入(MQTT)__快速开始_阿里云物联网套件-阿里云
查询API调用流量数据__API管理相关接口_API_API 网关-阿里云
使用STS访问__JavaScript-SDK_SDK 参考_对象存储 OSS-阿里云