閱讀574 返回首頁    go 火車采集器


文章采集器采集規則和發布模塊的對接

文章采集器采集規則和發布模塊的對接

作者:dong 發布於:2016-7-6 15:21 Wednesday 分類:官方公告


對於網站維護人員來說,在配置完文章采集規則後,還需要配置發布模塊,將采到的內容發布到網站中去。在線發布模塊,就是文章采集器通過網站後台,發布文章,也就是將你手動在網站後台發布文章的整個過程包含登錄網站後台,選擇欄目,到發布文章,這些步驟都寫到采集器裏麵就是在線發布模塊,然後規則采集到的值就通過標簽名傳遞給在線發布模塊,把數據提交到網站裏去。

那麼在我們常用的文章采集器​即火車采集器V9中,要如何完成采集規則和發布模塊的對接呢,新手朋友們請往下看。

采集規則.png

    如果要選擇發布到網站中,就選擇Web在線發布,然後勾選已經設置過的WEB配置就可以了。(如果大家還沒有掌握發布模塊的製作可以參見網頁抓取工具火車采集器發布模塊製作示例。)

    這裏需要提醒大家注意的是:我們所設置的采集內容標簽一定要和發布模塊的標簽個數以及名稱都保持一致,否則會導致發布出錯,如下圖四個標簽也對應四個同樣的標簽。

采集規則1.png

采集規則2.png

    完成以後在任務列表中勾選采集、發布,然後點擊開始即可運行。在默認情況下,火車采集器會把采集的數據先保存到自己的數據庫,然後根據用戶設置的發布配置,再從數據庫裏麵讀出數據通過發布配置把數據發布出去。

    但我們也可以選擇讓采集器采集到的數據不保存到數據庫,而是直接通過發布配置發布出去,也就是發布相關設置中的“邊采集邊發布”,發布時也可以選擇正序倒序亂序等,主要看用戶自己的使用需求了。


標簽: 火車采集器V9 文章采集器

相關日誌:

福利來啦:6.8折優惠碼太給力!

網頁抓取工具帶你走進大數據營銷

玩轉網頁抓取工具,2016年讓大數據更接地氣!

網頁抓取工具透析大數據生態圈技術層

網頁抓取工具助力大數據基礎建設

« 聽說你的老板讓你學會抓數據? | 網頁抓取工具:大數據崗位必備»

發表評論:

最後更新:2017-05-09 01:06:04

  上一篇:go 文章采集器抓取列表分頁示例
  下一篇:go 火車采集器V7V8版本無法登錄的解決辦法