阅读504 返回首页    go gooseeker集搜客


查看数据结果

1. 采集成功的话,网页数据会以xml文件形式保存在电脑的DataScraperWorks文件夹中,在DS打数机的文件菜单->存储路径中可以找到文件路径。


2. 在对应主题名的子文件夹中会看到成功采集的xml文件,xml文件是对应网页生成的,一个网页会生成一个xml文件,如果涉及到翻页采集,就会得到N个xml文件,所以,并不是按网址生成xml文件的。


3. xml文件可以用浏览器、记事本、excel打开,通过一些工具可以转为其他文件格式。例如:用集搜客会员中心的数据管理功能可以转换为excel格式,如下图数据表。

Tips:转为excel或其他格式可以方便导入到自己的数据库。


上篇文章:《DS打数机采集数据》                                                                           下篇文章:《xml转为excel》



若有疑问可以或集搜客爬虫软件

最后更新:2017-01-09 14:08:09

  上一篇:go Scrapy的架构初探
  下一篇:go Python即时网络爬虫项目启动说明