閱讀539 返回首頁    go gooseeker集搜客


【第28期】淘寶天貓評論采集

電商購物網站蘊含著不少的消費者特征信息,其中評論就是消費者意見的最直接表現,所以采集評論就變得很常見了。很多購物網站都有反爬蟲限製,限製100頁顯示就是其中一個,那麼如何能采集到更多的數據,答案就是分類采集,一般的購物網站會把評論分為好中差三種,我們可以分別采集好中差評論,這樣就能采到超過100頁,如果把類別名稱也采集下來,采完數據也就完成了數據的一個初步分類。

如何分類采集呢?針對淘寶天貓的評論,由於好中差評論沒有獨立網址,我們可以做連續動作來實現類別的點擊和數據采集。對於有獨立網址的類別,可以做層級采集,對類別的網址設置下級線索,這樣就能逐個類別采集。

點擊觀看培訓視頻



若有疑問可以或集搜客網絡爬蟲

最後更新:2017-01-09 14:08:11

  上一篇:go 連續點擊淘寶商品采集價格數據【第37期】
  下一篇:go 在Python3.5下安裝和測試Scrapy爬網站