【近戰】基於微博用戶關係與行為的用戶建模分析
【編者按】好的技術實戰分享從來不因為時間的流失而褪色。2011年開始運營的阿裏技術沙龍共積累35期,近100位深度實戰培訓資源(PPT+視頻)讓很多朋友大唿過癮。接棒阿裏技術沙龍,雲棲社區特別挑選最具人氣的12場深度實戰分享組成【近戰】的第一個係列。其中包含新浪微博、淘寶搜索、美團、美麗說、淘寶推薦、小米、支付寶、阿裏雲、淘寶無線在內,涵蓋建模、個性化推薦、排序學習、係統優化、數據監控、流量優化、架構探索等多方麵一線經驗總結。
以下為【近戰】第一篇,基於微博用戶關係與行為的用戶建模分析。
用戶建模是廣告、推薦、搜索算法最基礎也是最核心的技術問題之一,本報告將介紹新浪微博大數據挖掘團隊如何綜合利用社交關係和用戶行為來建立用戶模型。以下分享下精彩內容。
微博及大數據
微博作為中國最大的社交媒體平台,微博沉澱了海量的用戶,內容,關係,和行為數據。
其中用戶:注冊人數10億,月活人數1.98億,日活人數:8900萬。關係:關注關係近千億,分組關係50億+。內容:日增博文1億+,日增原創4000萬。行為:轉發6000萬, 評論3000萬,讚1億,收藏:1000萬, 查看200億。
圖1
如圖1,微博大數據要做什麼?要幫助用戶發現感興趣的內容,加快有價值內容的傳播效率。目標如何實現?要挖掘有能力生產垂直領域優質內容的用戶,挖掘用戶內容消費的興趣偏好。工作如何串聯?用戶能⼒力標簽,用戶興趣標簽,微博內容標簽。
大數據標簽體係
最後更新:2017-04-01 13:37:06