閱讀485 返回首頁    go 火車采集器


可視化采集軟件火車瀏覽器的邏輯相關操作

可視化采集軟件火車瀏覽器的邏輯相關操作

作者:dong 發布於:2016-9-23 17:48 Friday 分類:官方公告

可視化采集軟件火車瀏覽器​在編輯腳本的過程中需要對邏輯進行一係列設定,比如條件判斷、循環、跳轉、引用等,這裏就對邏輯的具體操作簡單講解下,介紹自己的經驗,希望幫助朋友們解決使用中遇到的問題。

圖片1.png

條件判斷有四種形式:1.條件判斷:

1當前頁麵源碼

圖片2.png2xpathhttps://bbs.locoyposter.com/post-21-1-1.html

圖片3.png

在使用變量判斷的時候,選擇判斷方式必須要選擇相等。3變量判斷  

4使用代碼片段

圖片4.png

https://bbs.locoyposter.com/forum.php?mod=viewthread&tid=75&extra=page%3D1%26filter%3Dtypeid%26typeid%3D5判斷值是否大於某個值等類似的判斷。具體使用方法:

2.循環:

圖片5.png

1在一個網址需要無限反複的采集或者填寫的時候,可以使用到無限循環循環一般是稍複雜的腳本中都會用到,其功能是非常強大的。其中具體有以下幾種:

2點擊固定元素:當需要重複點擊同一個元素的時候,比如點擊下一頁,便可以使用此功能

3點擊一組固定元素:當需要依次點擊頁麵中的一組元素時,用此功能。

4點擊指定的元素列表:將需要點擊元素的xpath 放在一個list變量中,再選用此功能,就可以依次點擊list變量中的xpath。

5遍曆list變量,需要訪問的元素放在list變量中,然後使用循環去一一訪問它,比如采集網頁是,list變來那個中存放的是網址,那麼循環遍曆是,級那個每次比昂裏的網址存放在一個文本型變量中,圖示“保存至變量”步驟,設置一個變量來臨時存儲要訪問的網址,然後將變量填入“打開網頁”步驟的訪問地址欄,這樣就可以循環打開list變量中的網址.

6從數據庫中查詢數據:使用sql語句,調用數據庫的數據。與列同名的變量可直接調用該列中的數據,所以使用下麵的保存至變量。具體使用方法:

https://bbs.locoyposter.com/post-222-1-1.html

7循環執行次數:可以直接填寫固定值或者使用計數器變量的值來控製循環次數。

3.跳轉:跳轉到其他步驟

圖片6.png

5.結束循環:循環步驟結束4.跳出本次循環:跳出當前循環的步驟,進行下一個循環

提示(跳出循環與結束循環的區別)

跳出循環:比如有 5個數,當前循環到3,使用跳出循環,則不再進行循環3的步驟,跳出這個循環後從循環數字4開始再循環

結束循環:同樣有 5個數,當前循環到3  使用結束循環,則循環結束,不再進行下麵數字的循環。

6.暫停等待:這個步驟用到會比較多,有些網頁打開加載比較慢(比如登錄時,頁麵跳轉時),就設置一個暫停等待的時間。等待的時間設置固定的時間,也可使用計數器變量或者隨機時間。也可以使用網頁中一個標誌性的xpath,作為等待指定的元素,即網頁中加載出這個元素後就進行下麵的操作,比如一個網頁中隻需要進行寫值時,就可以使用輸入框xpath作為等待指定元素。

標簽: 可視化采集軟件 火車瀏覽器​

相關日誌:

福利來啦:6.8折優惠碼太給力!

網頁抓取工具帶你走進大數據營銷

玩轉網頁抓取工具,2016年讓大數據更接地氣!

網頁抓取工具透析大數據生態圈技術層

網頁抓取工具助力大數據基礎建設

« 火車采集器軟件-今日頭條娛樂新聞采集規則分享 | 網頁數據抓取之自動分類功能»

發表評論:

最後更新:2017-05-09 01:06:04

  上一篇:go 抓取網頁數據工具的內容獲取方式
  下一篇:go 企業征信:大數據拚圖玩出新花樣