閱讀364 返回首頁    go 新東方


標簽模型配置__使用手冊_畫像分析-阿裏雲

實體配置

實體關係建模是把分散的多張表,以業務形態進行組織的一種方式,即圍繞著一個或多個實體(即描述的對象)的各種屬性和行為的描述。整個建模是圍繞著“實體”-“關係”-“標簽/屬性”這三個主要的概念展開的。實體關係建模是期望能夠把散落在不同存儲中的多張數據源表,及其之間的關係能夠進行統一管理、建模、數據同步,在這個統一的模型層之上進行興趣提取、整合分析、規則引擎、移動營銷各個產品或模塊的應用計算中。

實體,即客觀世界的一個對象,如人員、車輛、買家、賣家、商品都可以看作是一個實體。從數據表的角度來說,通常帶有唯一主鍵的表則代表一個實體,表中的每一個字段則相當於這個實體的屬性,如性別、年齡、收入、月均消費等。

從下圖示例可以看到,可以把多張表以買家、賣家、商品、成交、搜索這幾個實體和關係有機的組織起來,對跨存儲的數據表形成一個單一的視圖,進行有效的組織管理。在後續的分析與算法處理上,也都是基於這個實體關係模型進行相應的表達,免除對下層各個計算的複雜對接。

實體關係模型示例

在標簽建模當中,實體可以將多張具有同一主鍵的產生於不同數據庫同類表在邏輯層上聚合在一起,每一個字段都是這個實體的一個屬性標簽,形成一張“大寬表”。

點擊標簽中心-模型管理-實體關係管理,可以見到所創建的實體關係模型列表,您可以點擊左側的實體/關係列表,來查看實體的詳情。包括實體的定義和實體下所關聯的字段與標簽。

實體關係管理1

首先我們點擊右上角的添加實體來創建,如買家,您可以為之命名(要求唯一),中文名稱為買家,英文識別名稱為buyer,同時給這個邏輯實體命名一個抽象的“主鍵”,如buyer_id。

添加實體

接下來您可以將多個描述這個實體的表進行關聯,點擊下方的新增關聯字段選擇相應數據庫下的表的主鍵,關聯到這個實體上。再把相應表中所會用於分析的字段進行一一設置。

添加實體關聯字段

標簽配置

如上文所述,標簽是描述實體/關係的某一個屬性,一個字段作為同一個實體/關係下具有唯一性屬性描述。在設置的時候,您需要設置以下內容。在實體/關係設置頁麵下方已經關聯的表當中,點擊標簽數列下的具體數字鏈接,打開標簽設置彈窗,表示該表已經被設置登記為標簽的數量與總字段數。

標簽配置總覽

標簽詳細配置

  • 英文名(必填):標簽的標識,在一個租戶下不可重複,API調用時,需要使用英文名
  • 中文名(必填):標簽中文名,便於查找
  • 描述(選填):標簽的詳細描述
  • 所在類目(選填):當實體下的標簽太多時,可通過建立類目,對標簽進行分類瀏覽查看
  • 為空條件(選填):指定標簽數據為空時的字符,便於使用時,排除為空時的數據
  • 值類型(選填):標簽的數據分為枚舉、多值、數值,枚舉和多值需要通過指定標簽的具體取值,如性別的標簽需要明確取值,如{0:女;1:男}。標簽的值域類型有以下幾項。該標簽的為空條件、標簽類型和值字典。為空條件輸入一個或多個作為空值、未知值的數值;標簽類型有枚舉、數值、多值(分析型數據庫的一種特殊類型,是以多個個數不定的Key組成,通常一些人工標注的標簽屬性、選擇個數不定的多選題都可以用多值列的方式來存儲)。值字典則是指定該屬性的字典,您可以通過人工錄入的方式
  • 關聯實體(選填):或者是建立一個實體,把該標簽關聯到相應的實體上,並標注值字典所需要匹配返回的屬性字段。 標簽的取值可以通過某個實體下的標簽數據進行獲取,也可以跳過此項,在值來源中手動輸入
  • 值來源(選填):當標簽的取值不多時,可通過手動的方式錄入;如果標簽取值量非常大,比如省份、城市、品牌這樣的標簽可以通過關聯其它標簽的方式來獲取
  • 值類型(必填):常用的數據值類型,根據標簽具體的數據情況選擇即可。係統會根據相應表的字段來匹配一個字段類型,如BIGINT/DATETIME/STRING。

關係配置

關係,是實體與實體之間所發生的連接,通常表示某一種行為/一個事實,如成交、搜索、出行。從數據表的角度來看,這樣的表通常被稱為”事實表“,往往是有多個聯合主鍵(或是說都是外鍵),如成交表示的是“買家”-“賣家”-“商品”之間的關係,往往沒有唯一的主鍵(或是說唯一主鍵,如訂單ID在分析場景中不發揮主要作用)。 關係配置頁麵

點擊關係選項卡,選擇新建關係。新建一個關係需要指定關係的名稱,以及關係是連接哪幾個實體的。

添加新關係

創建完關係後,選擇該關係所關聯的數據表,並把幾個實體所對應的外鍵進行指定。關係上也可以掛接屬性,如成交的時間、金額、次數等,下一步您可以將指定為關係的表中的其它字段配置位標簽。標簽的相關配置與實體的相關配置當中一致。

關係表關聯設置

在實體和關係設置完成之後,即可以在模型探索當中查看所構建的實體關係模型,並進行數據同步。

最後更新:2016-12-01 18:48:15

  上一篇:go 雲計算資源注冊__使用手冊_畫像分析-阿裏雲
  下一篇:go 數據智能同步__使用手冊_畫像分析-阿裏雲