閱讀355 返回首頁    go 阿裏雲 go 技術社區[雲棲]


規則配置__輿情分析_快速開始_公眾趨勢分析-阿裏雲

配置好專題及關鍵詞後,如果抓取的內容太多怎麼辦?其中一個辦法是通過設置“過濾規則”來對抓取內容進行過濾。滿足定義好的過濾規則的內容將不再抓取。

1、添加過濾規則

在控製台首頁,點擊左邊菜單“後台管理—規則配置”即進入規則管理界麵,默認是打開“過濾規則”管理界麵。頂部有個重要選項“是否跳過垃圾箱”建議“開啟”,即過濾的內容是否進去垃圾箱,如果開啟,則過濾內容不進去垃圾箱,則不消耗推送輿情配額。keywords

點擊”添加規則”按鈕,即可按關鍵詞、反饋名/源站名稱、網站URL來進行規則設定。如下圖:keywords

“規則”需要根據下麵的“過濾類型”來填寫不同的內容,關鍵詞是針對抓取的文本內容來過濾的,中“反饋名/源站名稱”則是針對抓取文本所屬站點名稱來過濾的,如“網易娛樂”、“微博”、“Techweb”,“網站url”則是針對抓取的站點url來過濾的,如m.techweb.com.cn。

填寫“規則”需學習下麵幾點:

a、規則可以直接寫關鍵字進行匹配,示例:搜索 。會把包含”搜索“的內容進行匹配

b、多個關鍵字同時匹配請用 AND (注意前後有空格)來連接,表示且的邏輯:同時包含多個關鍵詞才進行匹配。示例:搜索 AND 店鋪,會把同時包含搜索+店鋪的內容進行匹配

c、匹配任意一個關鍵字用 , (英文的逗號)或者 OR (注意前後有空格)來連接。如:搜索,找不到。表示匹配到”搜索”或者”找不到”的內容。

d、支持括號。示例:(搜索 OR 找不到) AND 店鋪。會匹配包含”店鋪“並且”搜索“的內容 或者 包含”店鋪“並且”找不到“的內容。

e、支持不包含,隻需要在不包含詞加英文感歎號。示例:!淘寶 AND 阿裏。會匹配包含“阿裏”並且不包含“淘寶”的內容。

f、規則支持正則表達式,隻需要在規則前增加RE(空格),示例1: RE ^w+$,表示對純數字/英文的內容進行匹配。示例2:RE^[sS]{0,5}$,表示對小於5個字符的內容進行匹配

g、正則表達式測試教程

2、編輯&刪除過濾規則

每條規則的右側都有“編輯”及“刪除”按鈕,按步驟操作即可。

標簽規則

配置好專題及關鍵詞後,想對抓取的內容建立多層級的知識結構,則可以使用“標簽規則”來實現。

1、添加標簽規則

在控製台首頁,點擊左邊菜單“後台管理—規則配置”即進入規則管理界麵,默認是打開“過濾規則”,點擊tab”標簽規則”按鈕進入標簽規則管理界麵,在這裏可以建立針對抓取內容的多級標簽。標簽包括“根標簽”和“子標簽”根標簽:最頂級的標簽,它上麵沒有比它更大的標簽,子標簽:附著在某一標簽下麵的標簽。如下圖,針對“iPhone7”這個關鍵詞抓取的內容,想從“新功能”“性價比”兩方麵來歸類,且“新功能”關注了電池、耳機、屏幕等:keywords在“添加標簽規則”界麵需要輸入自定義的標簽名稱及規則(多個關鍵詞組合),填寫注意事項同上“過濾規則”。

2、編輯&刪除標簽規則

鼠標選中每條標簽,即可唿出“添加下一級標簽”、“編輯”及“刪除”按鈕,按步驟操作即可。標簽被編輯修改之後,大約過2分鍾之前打過輿情的標簽會很快修改。

最後更新:2016-11-24 11:23:49

  上一篇:go 圖表分析__輿情分析_快速開始_公眾趨勢分析-阿裏雲
  下一篇:go 報警配置__輿情分析_快速開始_公眾趨勢分析-阿裏雲