閱讀631 返回首頁    go 阿裏雲


表__基本概念_基本介紹_大數據計算服務-阿裏雲

表是 MaxCompute 的數據存儲單元。它在邏輯上也是由行和列組成的二維結構,每行代表一條記錄,每列表示相同數據類型的一個字段,一條記錄可以包含一個或多個列,各個列的名稱和類型構成這張表的 Schema。

MaxCompute的表格分兩種類型:外部表及內部表。

對於內部表,所有的數據都被存儲在MaxCompute中。表中的列可以是 MaxCompute 支持的任意種數據類型(Bigint,Double,String,Boolean,Datetime)。MaxCompute 中的各種不同類型計算任務的操作對象(輸入、輸出)都是表。用戶可以創建表,刪除表以及向表中導入數據。

對於外部表,MaxCompute並不真正持有數據,表格的數據可以存放在OSS中。MaxCompute僅會記錄表格的Meta信息。用戶可以通過MaxCompute的外部表機製處理OSS上的非結構化數據,例如:視頻、音頻、基因、氣象、地理信息等。處理流程包括:

  1. 將數據上傳至OSS;
  2. RAM產品中授予MaxCompute服務讀取OSS數據權限;
  3. 自定義Extractor:用於讀取OSS上的特殊格式數據。目前,MaxCompute默認提供CSV格式的Extractor,並提供視頻格式數據讀取的代碼樣例;
  4. 創建外部表
  5. 執行SQL作業分析數據;

注意:

最後更新:2016-10-26 14:17:46

  上一篇:go 項目空間__基本概念_基本介紹_大數據計算服務-阿裏雲
  下一篇:go 數據類型__基本概念_基本介紹_大數據計算服務-阿裏雲