53
windows
開發者指南___公眾趨勢分析-阿裏雲
一、概述
開發者可以通過API數據接口進行:關鍵詞專題配置、關鍵詞配置、接收實時抓取數據、微博傳播路徑分析。還可以利用現數據分析。
注意1:數據接口僅在購買”API版本”後才開放。
一、準備工作
1 、通過實名認證的阿裏雲賬號
2、開通消息服務(如果不需要接收輿情推送,此步可不需要做)
購買API版本前,需要先開通消息服務(此服務接收數據是免費的),用於接收實時數據推送。
二、使用API
進入公眾趨勢分析後,點擊左側導航的:開放接口。即可進行在線的API測試。
測試沒問題後,即可在代碼中進行API調用。詳細的API文檔請 點擊這裏
三、接收實時推送的輿情數據
1、開通消息隊列服務
請確保此步已經完成。請參考一、準備工作的第2點。
2、進行消息訂閱
購買API版本後,請聯係我們的銷售或者提交工單,要求技術同學添加授權。授權好後,使用主賬號登錄。在阿裏雲控製台-消息隊列服務中,看到已經授權好的topic。
點擊申請訂閱,填寫接收方的Consumer ID。此ID為全局唯一,用於標識接收方。名字以CID_開頭,後麵隨意,滿足規則即可。一個CID表示一組機器,一條推送隻會被一組機器裏麵的其中一台機器消費。
3、編輯訂閱代碼
點擊訂閱管理,可以看到訂閱關係已經創建好了。參考示例寫代碼。
消息隊列服務的詳情使用說明請參考這裏。
4、推送數據格式說明
推送的數據包含2部分:
- 原始輿情數據本身。 在MetaQ消息中,用Tag:baseData表示。
- 算法聚類結果:用於告訴業務方,哪些信息是相似的輿情。用Tag:cluster 表示。相似算法又由兩部分組成:
- 一部分是實時地進行相似判斷:數據會快速的進行最近一定時間範圍內(通常為一周)數據的判斷相似。延時較低,秒級別。
- 另外一部分是離線地進行相似判斷:數據會將產品中所有的曆史數據進行相似度計算。延時更高。可能為小時級別。
baseData屬性說明
參數名 | 參數類型 | 說明 |
---|---|---|
id | int | 輿情對象主鍵 |
productId | int | 先知的產品編號 |
spiderTopicId | int | 抓取類型:與源站類型是一一對應的。 |
monitorKeywordId | int | 輿情抓取關鍵詞的全局ID |
monitorKeywords | string | 輿情抓取的關鍵字內容 |
monitorTopicId | int | 專題ID |
from | string | 網站名/微博作者/微信公眾號 |
url | string | 輿情鏈接。對應新聞URL/微博URL/微信公眾號文章URL等 |
filterStatus | int | 0:待確認輿情,1:有效輿情 2:被過濾的輿情(放垃圾箱) |
createdAt | date | 抓取時間 |
pubTime | date | 新聞/微博發布的時間(如果隻獲取到天,時分秒都為0) |
wbId | int | 微博的主鍵ID |
wbUserId | int | 微博用戶的主鍵ID |
wbFansCount | int | 微博粉絲數。可能在數據量大的情況下此值為空. |
wbRepostCount | int | 微博轉發數。原創微博抓取瞬間幾乎都為0,如果為轉發微博,建議開發者更新被轉發微博的轉發次數 |
wbCommentCount | int | 微博評論數。原創微博抓取瞬間幾乎都為0,如果為轉發微博,建議開發者更新被轉發微博的評論次數 |
wbLikeCount | int | 微博讚數。原創微博抓取瞬間幾乎都為0,如果為轉發微博,建議開發者更新被轉發微博的點讚次數 |
wbVerifiedType | int | 微博用戶認證類型 0-普通,1-個人認證,2-企業認證,3-微博達人。可能在數據量大的情況下此值為空。 |
wbType | int | 微博類型:0為原創微博,1為轉發微博,2為微博評論 |
emotionTendency | int | 情感極性0中性 1正麵 -1負麵 |
emotionScore | int | 情感分數,絕對值越大,表示對應的情感越強烈 |
urlMD5 | string | url的md5哈希值 |
tags | string | 自動打上的標簽,多個會用豎線進行分隔。 |
langType | string | 語言類型。如ch表示中文,en表示英文 |
subject | string | 文章標題。如果是微博,則為微博內容的摘要。 |
description | string | 正文摘要(100字以內)。如果是微博,則為微博內容的前100個字符 |
translateSubject | string | 如果是非中文和英文,翻譯成英文之後的標題 |
translateDescription | string | 如果是非中文和英文,翻譯成英文之後的詳情 |
合並相似推送屬性說明
示例:有數據A、B、C,三條輿情,ID分別為x,y,z這三條被算法認為是相似的。那麼clusterid則為其中一條ID,假如為x。feedbackids為另外兩條的ID。[y,z]。
參數名 | 參數類型 | 說明 |
---|---|---|
productid | int | 產品空間的主鍵 |
clusterid | int | 類中心ID。對應baseData中的id |
feedback_ids | array | 類簇數據ID集合,是一個數組 |
type | string | realtime - 實時計算,offline - 離線計算 |
最後更新:2016-12-01 10:46:01
上一篇:
移動端操作手冊__快速開始_公眾趨勢分析-阿裏雲
下一篇:
API指南__開發者指南_公眾趨勢分析-阿裏雲
容器服務監控__雲服務監控_用戶指南_雲監控-阿裏雲
日誌收集__常見問題_日誌服務-阿裏雲
擴容數據盤(Linux)__擴容磁盤概覽_磁盤_用戶指南_雲服務器 ECS-阿裏雲
TableInBatchWriteRowRequest__DataType_API 參考_表格存儲-阿裏雲
GetLiveChannelHistory__關於LiveChannel的操作_API 參考_對象存儲 OSS-阿裏雲
聯係不到渠道合作夥伴域名如何做解析__渠道商下客戶問題_渠道合作夥伴_合作夥伴-阿裏雲
PostgreSQL中的數據是否可以放到雲數據庫HybridDB版進行分析?__使用管理常見問題_產品相關問題_雲數據庫 HybridDB-阿裏雲
查詢APP列表__應用管理相關接口_API_API 網關-阿裏雲
主題使用手冊__Java SDK_SDK使用手冊_消息服務-阿裏雲
流程介紹__API快速入門_快速入門_彈性伸縮-阿裏雲
相關內容
常見錯誤說明__附錄_大數據計算服務-阿裏雲
發送短信接口__API使用手冊_短信服務-阿裏雲
接口文檔__Android_安全組件教程_移動安全-阿裏雲
運營商錯誤碼(聯通)__常見問題_短信服務-阿裏雲
設置短信模板__使用手冊_短信服務-阿裏雲
OSS 權限問題及排查__常見錯誤及排除_最佳實踐_對象存儲 OSS-阿裏雲
消息通知__操作指南_批量計算-阿裏雲
設備端快速接入(MQTT)__快速開始_阿裏雲物聯網套件-阿裏雲
查詢API調用流量數據__API管理相關接口_API_API 網關-阿裏雲
使用STS訪問__JavaScript-SDK_SDK 參考_對象存儲 OSS-阿裏雲