閱讀504 返回首頁    go gooseeker集搜客


查看數據結果

1. 采集成功的話,網頁數據會以xml文件形式保存在電腦的DataScraperWorks文件夾中,在DS打數機的文件菜單->存儲路徑中可以找到文件路徑。


2. 在對應主題名的子文件夾中會看到成功采集的xml文件,xml文件是對應網頁生成的,一個網頁會生成一個xml文件,如果涉及到翻頁采集,就會得到N個xml文件,所以,並不是按網址生成xml文件的。


3. xml文件可以用瀏覽器、記事本、excel打開,通過一些工具可以轉為其他文件格式。例如:用集搜客會員中心的數據管理功能可以轉換為excel格式,如下圖數據表。

Tips:轉為excel或其他格式可以方便導入到自己的數據庫。


上篇文章:《DS打數機采集數據》                                                                           下篇文章:《xml轉為excel》



若有疑問可以或集搜客爬蟲軟件

最後更新:2017-01-09 14:08:09

  上一篇:go Scrapy的架構初探
  下一篇:go Python即時網絡爬蟲項目啟動說明