阅读305 返回首页    go gooseeker集搜客


【第32期】美团网店铺信息采集

以美团网为例,采集分类目录下都列表信息和每个店铺的链接,再根据店铺链接进入店铺的详情页面,批量采集店铺的信息。

做规则的要点就是,对分类目录页做第一级规则,包括直观标注、样例复制、抓店铺链接并对它勾选下级线索、设置翻页,这些都是在第一级列表页的规则里设置好;再对店铺详情页做第二级规则,只要直观标注出想采的信息就行了。

采集时,先运行第一级规则,待抓到了店铺链接,就可以运行第二级规则了。

点击观看培训视频



若有疑问可以或集搜客爬虫软件

最后更新:2017-01-09 14:08:12

  上一篇:go 采集网页html源码
  下一篇:go XML文件结构