阅读170 返回首页    go gooseeker集搜客


中级教程

一、采集流程设计

采集流程:做规则前就要计划

二、单点采集

单点采集一条信息的标题网址价格

合并采集网页的分散文本信息

三、批量采集

    3.1 样例复制

样例复制批量采集相同结构的信息

嵌套样例复制解决采集多模块样例

样例复制相关问题的解决方法集锦

    3.2 翻页采集

记号线索:利用文本记号设置翻页

相对线索:解决数字页码的翻页

没有文本记号怎么设置翻页线索

翻页重复、死循环的解决方法

翻页采集相关问题的解决方法集锦

    3.3 定位标志

定位标志提高规则的精度和适用度

定位标志批量采集相同定位信息

避免不合适的定位标志影响抓取规则

定位标志相关问题的解决方法集锦

四、层级网页采集

模拟点击切换到另一标签窗口采数据

制作层级规则深入多层网页采数据

层级采集相关问题的解决方法集锦

五、网页图片采集

怎样抓取网页的同时下载图片

图片采集相关问题的解决方法集锦


最后更新:2017-01-09 14:08:12

  上一篇:go 连续动作:自动搜索关键词采集信息—以京东为例
  下一篇:go 采集网页html源码