閱讀694 返回首頁    go gooseeker集搜客


xml轉換為excel

一、兩種操作方式

通過會員中心使xml格式轉為excel格式共有兩種方式,分為手工和自動,操作步驟如下:

方式一 :通過規則管理界麵手工導入數據,然後導出excel數據(注意控製ZIP包的大小)

方式二 : 設置自動入庫再用爬蟲群采數據,最後導出excel數據


二、操作步驟

方式1:通過規則管理界麵手工導入數據,然後導出excel數據

1.1,在硬盤的主題名文件夾裏選中多個xml文件直接壓縮到zip包,不要夾雜除xml外的文件夾或其他文件類型。

1.2,登錄集搜客官網,進入會員中心->規則管理->我的規則。

1.3,點擊對應主題名進入到管理頁麵,點擊“導入數據”按鈕,點擊附件,選擇數據包zip,點擊導入。

1.4,導入成功後即可“導出數據”,在“曆史記錄”中可以重複下載。

注意:ZIP包不能大於10M,為了穩定上傳,最好分批壓縮成多個2M的包。



方式2:設置自動入庫再用爬蟲群采數據,最後導出excel數據

2.1,登錄集搜客官網,進入會員中心->規則管理->我的規則。

2.2,點擊對應主題名進入到管理頁麵,點擊“調度”按鈕,勾選“結果入庫”,點擊“確認”。

2.3,然後運行爬蟲群采集數據。爬蟲群使用方法:打開DS打數機的菜單,選擇爬蟲群菜單->配置,勾上自啟動,再點擊保存,最後重啟DS打數機,就會彈出爬蟲窗口自動采集該主題的網頁數據。

2.4,采集完成後,回到主題的管理頁麵,點擊“導出數據”即可。

【注意】必須使用爬蟲群窗口采集數據,才會自動導入數據。點擊單搜/集搜/爬數據按鈕,其爬蟲窗口不受調度控製。

【注意】數據管理功能是增值服務,每個規則可以免費導出1萬條數據,超額請購買“專業版or旗艦版爬蟲”或“數據倉庫”來擴大儲存量後再繼續導出數據,或購買“倉庫清掃”清理舊數據後再來存儲新數據。


上篇文章:《采集網頁數據》                                                                           下篇文章:《DS打數機采集數據》

若有疑問可以或集搜客爬蟲軟件

最後更新:2017-01-09 14:08:09

  上一篇:go Scrapy:Python3下的第一次運行測試
  下一篇:go Python使用xslt提取網頁數據