694
gooseeker集搜客
xml轉換為excel
一、兩種操作方式
通過會員中心使xml格式轉為excel格式共有兩種方式,分為手工和自動,操作步驟如下:
方式一 :通過規則管理界麵手工導入數據,然後導出excel數據(注意控製ZIP包的大小)
方式二 : 設置自動入庫再用爬蟲群采數據,最後導出excel數據
二、操作步驟
方式1:通過規則管理界麵手工導入數據,然後導出excel數據
1.1,在硬盤的主題名文件夾裏選中多個xml文件直接壓縮到zip包,不要夾雜除xml外的文件夾或其他文件類型。
1.2,登錄集搜客官網,進入會員中心->規則管理->我的規則。
1.3,點擊對應主題名進入到管理頁麵,點擊“導入數據”按鈕,點擊附件,選擇數據包zip,點擊導入。
1.4,導入成功後即可“導出數據”,在“曆史記錄”中可以重複下載。
注意:ZIP包不能大於10M,為了穩定上傳,最好分批壓縮成多個2M的包。
方式2:設置自動入庫再用爬蟲群采數據,最後導出excel數據
2.1,登錄集搜客官網,進入會員中心->規則管理->我的規則。
2.2,點擊對應主題名進入到管理頁麵,點擊“調度”按鈕,勾選“結果入庫”,點擊“確認”。
2.3,然後運行爬蟲群采集數據。爬蟲群使用方法:打開DS打數機的菜單,選擇爬蟲群菜單->配置,勾上自啟動,再點擊保存,最後重啟DS打數機,就會彈出爬蟲窗口自動采集該主題的網頁數據。
2.4,采集完成後,回到主題的管理頁麵,點擊“導出數據”即可。
【注意】必須使用爬蟲群窗口采集數據,才會自動導入數據。點擊單搜/集搜/爬數據按鈕,其爬蟲窗口不受調度控製。
【注意】數據管理功能是增值服務,每個規則可以免費導出1萬條數據,超額請購買“專業版or旗艦版爬蟲”或“數據倉庫”來擴大儲存量後再繼續導出數據,或購買“倉庫清掃”清理舊數據後再來存儲新數據。
上篇文章:《采集網頁數據》 下篇文章:《DS打數機采集數據》

最後更新:2017-01-09 14:08:09