閱讀53 返回首頁    go windows


開發者指南___公眾趨勢分析-阿裏雲

一、概述

開發者可以通過API數據接口進行:關鍵詞專題配置、關鍵詞配置、接收實時抓取數據、微博傳播路徑分析。還可以利用現數據分析。

注意1:數據接口僅在購買”API版本”後才開放。

一、準備工作

1 、通過實名認證的阿裏雲賬號

2、開通消息服務(如果不需要接收輿情推送,此步可不需要做)

購買API版本前,需要先開通消息服務(此服務接收數據是免費的),用於接收實時數據推送。

開通入口

二、使用API

進入公眾趨勢分析後,點擊左側導航的:開放接口。即可進行在線的API測試。

入口

測試沒問題後,即可在代碼中進行API調用。詳細的API文檔請 點擊這裏

三、接收實時推送的輿情數據

1、開通消息隊列服務

請確保此步已經完成。請參考一、準備工作的第2點。

2、進行消息訂閱

購買API版本後,請聯係我們的銷售或者提交工單,要求技術同學添加授權。授權好後,使用主賬號登錄。在阿裏雲控製台-消息隊列服務中,看到已經授權好的topic。

點擊申請訂閱,填寫接收方的Consumer ID。此ID為全局唯一,用於標識接收方。名字以CID_開頭,後麵隨意,滿足規則即可。一個CID表示一組機器,一條推送隻會被一組機器裏麵的其中一台機器消費。

3、編輯訂閱代碼

點擊訂閱管理,可以看到訂閱關係已經創建好了。參考示例寫代碼。

消息隊列服務的詳情使用說明請參考這裏

4、推送數據格式說明

推送的數據包含2部分:

  1. 原始輿情數據本身。 在MetaQ消息中,用Tag:baseData表示。
  2. 算法聚類結果:用於告訴業務方,哪些信息是相似的輿情。用Tag:cluster 表示。相似算法又由兩部分組成:
  • 一部分是實時地進行相似判斷:數據會快速的進行最近一定時間範圍內(通常為一周)數據的判斷相似。延時較低,秒級別。
  • 另外一部分是離線地進行相似判斷:數據會將產品中所有的曆史數據進行相似度計算。延時更高。可能為小時級別。
baseData屬性說明
參數名 參數類型 說明
id int 輿情對象主鍵
productId int 先知的產品編號
spiderTopicId int 抓取類型:與源站類型是一一對應的。
monitorKeywordId int 輿情抓取關鍵詞的全局ID
monitorKeywords string 輿情抓取的關鍵字內容
monitorTopicId int 專題ID
from string 網站名/微博作者/微信公眾號
url string 輿情鏈接。對應新聞URL/微博URL/微信公眾號文章URL等
filterStatus int 0:待確認輿情,1:有效輿情 2:被過濾的輿情(放垃圾箱)
createdAt date 抓取時間
pubTime date 新聞/微博發布的時間(如果隻獲取到天,時分秒都為0)
wbId int 微博的主鍵ID
wbUserId int 微博用戶的主鍵ID
wbFansCount int 微博粉絲數。可能在數據量大的情況下此值為空.
wbRepostCount int 微博轉發數。原創微博抓取瞬間幾乎都為0,如果為轉發微博,建議開發者更新被轉發微博的轉發次數
wbCommentCount int 微博評論數。原創微博抓取瞬間幾乎都為0,如果為轉發微博,建議開發者更新被轉發微博的評論次數
wbLikeCount int 微博讚數。原創微博抓取瞬間幾乎都為0,如果為轉發微博,建議開發者更新被轉發微博的點讚次數
wbVerifiedType int 微博用戶認證類型 0-普通,1-個人認證,2-企業認證,3-微博達人。可能在數據量大的情況下此值為空。
wbType int 微博類型:0為原創微博,1為轉發微博,2為微博評論
emotionTendency int 情感極性0中性 1正麵 -1負麵
emotionScore int 情感分數,絕對值越大,表示對應的情感越強烈
urlMD5 string url的md5哈希值
tags string 自動打上的標簽,多個會用豎線進行分隔。
langType string 語言類型。如ch表示中文,en表示英文
subject string 文章標題。如果是微博,則為微博內容的摘要。
description string 正文摘要(100字以內)。如果是微博,則為微博內容的前100個字符
translateSubject string 如果是非中文和英文,翻譯成英文之後的標題
translateDescription string 如果是非中文和英文,翻譯成英文之後的詳情
合並相似推送屬性說明

示例:有數據A、B、C,三條輿情,ID分別為x,y,z這三條被算法認為是相似的。那麼clusterid則為其中一條ID,假如為x。feedbackids為另外兩條的ID。[y,z]。

參數名 參數類型 說明
productid int 產品空間的主鍵
clusterid int 類中心ID。對應baseData中的id
feedback_ids array 類簇數據ID集合,是一個數組
type string realtime - 實時計算,offline - 離線計算

最後更新:2016-12-01 10:46:01

  上一篇:go 移動端操作手冊__快速開始_公眾趨勢分析-阿裏雲
  下一篇:go API指南__開發者指南_公眾趨勢分析-阿裏雲