閱讀304 返回首頁    go 阿裏雲


數據準備__基礎示例—完整數據開發_場景教程_大數據開發套件-阿裏雲

本示例假設用戶-品牌信息(源數據表)存儲在業務方的RDS上,進而利用數加>數據開發套件進行數據同步、數據加工操作來詳細闡述常見開發流程“數據產生>數據收集和存儲>分析和計算”。

示例中涉及到相關數據如下:

■ 源數據如附件,數據說明如下:

字段 字段說明 提取說明
user_id 用戶標識
brand_id 品牌ID
type 用戶對品牌的行為類型 點擊:0;購買:1;收藏:2;加入購物車:3
visit_datetime 行為時間 格式:年月日(yyyymmdd)

該份數據主要是記錄20150415-20150815四個月的用戶行為信息,本實例中我們將以該份數據做源數據進行分析產出目標表。

■ 本示例實現過程涉及到的ODPS表說明:

序號 表名 說明
1 s_user_brand_demo 用戶-品牌行為信息源表
2 b_cvr_demo 品牌轉化率表,前3個月品牌的購買用戶數/點擊數
3 ub_action_demo 用戶偏好表,統計用戶最近7天和最近3天的行為次數
4 ub_features_demo 用戶-品牌所有特征表

經分析源數據visit_datetime字段剛好是年月日,為了提高後續查詢速度,源表s_user_brand_demo建為分區表,以字段visit_datetime轉成分區,用戶數據每天都不斷新增變化,本示例的表我們都以年月日作為分區表。

最後更新:2016-11-23 16:04:08

  上一篇:go 示例說明__基礎示例—完整數據開發_場景教程_大數據開發套件-阿裏雲
  下一篇:go 配置RDS數據源__基礎示例—完整數據開發_場景教程_大數據開發套件-阿裏雲