閱讀170 返回首頁    go gooseeker集搜客


中級教程

一、采集流程設計

采集流程:做規則前就要計劃

二、單點采集

單點采集一條信息的標題網址價格

合並采集網頁的分散文本信息

三、批量采集

    3.1 樣例複製

樣例複製批量采集相同結構的信息

嵌套樣例複製解決采集多模塊樣例

樣例複製相關問題的解決方法集錦

    3.2 翻頁采集

記號線索:利用文本記號設置翻頁

相對線索:解決數字頁碼的翻頁

沒有文本記號怎麼設置翻頁線索

翻頁重複、死循環的解決方法

翻頁采集相關問題的解決方法集錦

    3.3 定位標誌

定位標誌提高規則的精度和適用度

定位標誌批量采集相同定位信息

避免不合適的定位標誌影響抓取規則

定位標誌相關問題的解決方法集錦

四、層級網頁采集

模擬點擊切換到另一標簽窗口采數據

製作層級規則深入多層網頁采數據

層級采集相關問題的解決方法集錦

五、網頁圖片采集

怎樣抓取網頁的同時下載圖片

圖片采集相關問題的解決方法集錦


最後更新:2017-01-09 14:08:12

  上一篇:go 連續動作:自動搜索關鍵詞采集信息—以京東為例
  下一篇:go 采集網頁html源碼