阅读631 返回首页    go 阿里云 go 技术社区[云栖]


表__基本概念_基本介绍_大数据计算服务-阿里云

表是 MaxCompute 的数据存储单元。它在逻辑上也是由行和列组成的二维结构,每行代表一条记录,每列表示相同数据类型的一个字段,一条记录可以包含一个或多个列,各个列的名称和类型构成这张表的 Schema。

MaxCompute的表格分两种类型:外部表及内部表。

对于内部表,所有的数据都被存储在MaxCompute中。表中的列可以是 MaxCompute 支持的任意种数据类型(Bigint,Double,String,Boolean,Datetime)。MaxCompute 中的各种不同类型计算任务的操作对象(输入、输出)都是表。用户可以创建表,删除表以及向表中导入数据。

对于外部表,MaxCompute并不真正持有数据,表格的数据可以存放在OSS中。MaxCompute仅会记录表格的Meta信息。用户可以通过MaxCompute的外部表机制处理OSS上的非结构化数据,例如:视频、音频、基因、气象、地理信息等。处理流程包括:

  1. 将数据上传至OSS;
  2. RAM产品中授予MaxCompute服务读取OSS数据权限;
  3. 自定义Extractor:用于读取OSS上的特殊格式数据。目前,MaxCompute默认提供CSV格式的Extractor,并提供视频格式数据读取的代码样例;
  4. 创建外部表
  5. 执行SQL作业分析数据;

注意:

最后更新:2016-10-26 14:17:46

  上一篇:go 项目空间__基本概念_基本介绍_大数据计算服务-阿里云
  下一篇:go 数据类型__基本概念_基本介绍_大数据计算服务-阿里云