閱讀892 返回首頁    go gooseeker集搜客


集搜客文本分詞標注工具使用指南2-篩選標簽詞

二、根據研究目的篩選標簽詞

用文本分詞標注工具導入數據成功後,進入第2步篩選標簽詞,也就是文本分類中的特征選擇和特征抽取的步驟。在這裏,我們會看到按照詞頻降序排列的分詞結果,而我們要做的是逐屏瀏覽,選出要研究的詞語。

很多不需要的單個詞由於詞頻很大而排在前麵,大家可以根據需要過濾掉英文、數字、單個詞、網址等詞語。


點擊詞語可以查看樣本數據,並且支持添加單個標簽詞。


點擊底部的“確定”,表示確定選擇哪些詞語和不要哪些詞語,然後自動進入下一頁,也就是說,瀏覽並確定過的詞語後麵就不會再展示了,而選中的詞語會記錄在“篩選結果”中。


如果已有一批標簽詞,可以通過“增加標簽詞”來批量導入,省略掉第二步“篩選標簽詞”的過程。


若有疑問可以或集搜客爬蟲軟件

最後更新:2017-01-09 14:08:12

  上一篇:go 集搜客網絡爬蟲安裝說明
  下一篇:go 【第35期】知網精確采集2