閱讀305 返回首頁    go gooseeker集搜客


【第32期】美團網店鋪信息采集

以美團網為例,采集分類目錄下都列表信息和每個店鋪的鏈接,再根據店鋪鏈接進入店鋪的詳情頁麵,批量采集店鋪的信息。

做規則的要點就是,對分類目錄頁做第一級規則,包括直觀標注、樣例複製、抓店鋪鏈接並對它勾選下級線索、設置翻頁,這些都是在第一級列表頁的規則裏設置好;再對店鋪詳情頁做第二級規則,隻要直觀標注出想采的信息就行了。

采集時,先運行第一級規則,待抓到了店鋪鏈接,就可以運行第二級規則了。

點擊觀看培訓視頻



若有疑問可以或集搜客爬蟲軟件

最後更新:2017-01-09 14:08:12

  上一篇:go 采集網頁html源碼
  下一篇:go XML文件結構