539
gooseeker集搜客
【第28期】淘寶天貓評論采集
電商購物網站蘊含著不少的消費者特征信息,其中評論就是消費者意見的最直接表現,所以采集評論就變得很常見了。很多購物網站都有反爬蟲限製,限製100頁顯示就是其中一個,那麼如何能采集到更多的數據,答案就是分類采集,一般的購物網站會把評論分為好中差三種,我們可以分別采集好中差評論,這樣就能采到超過100頁,如果把類別名稱也采集下來,采完數據也就完成了數據的一個初步分類。
如何分類采集呢?針對淘寶天貓的評論,由於好中差評論沒有獨立網址,我們可以做連續動作來實現類別的點擊和數據采集。對於有獨立網址的類別,可以做層級采集,對類別的網址設置下級線索,這樣就能逐個類別采集。
點擊觀看培訓視頻






最後更新:2017-01-09 14:08:11