閱讀144 返回首頁    go 火車采集器


使用插件配合采集器過濾不需要的數據(PHP)

使用插件配合采集器過濾不需要的數據(PHP)

作者:小文 發布於:2010-10-26 9:12 Tuesday 分類:免費插件

有時我們需要對采集的內容長度進行限製.比如標題長度不得小於3大於20,並且不能包含某些字符串.我們可以在插件中寫相關的代碼,將采集的數據清設置為空,然後在采集器的標簽設置中,設置該標簽內容不得為空,然後在係統設置中設置內容不符合時刪除記錄,就可以快速的將不需要的代碼刪除掉了.以後是PHP的示例代碼.

<?php
if(array_key_exists('標題',$LabelArray))
{
    $title=$LabelArray['標題'];
    if(strlen($title)<3||strlen($title)>20||strpos($title,'╩')!==false) $LabelArray['標題']='';
}

echo serialize($LabelArray);
?>

相關日誌:

火車采集器偽原創插件V9版

單條記錄下載文件名加自增ID

火車采集器二維碼識別插件,已增加V7版本

jin11顏色尺碼獲取插件

百度相關搜索插件V7版(最後更新2012.11.23)

« 火車采集器2011目標 | 新浪微博評論及轉發數采集插件(C#)»

發表評論:

最後更新:2017-05-09 01:05:54

  上一篇:go 使用Post方法采集獲取網址列表(2010.11.16)
  下一篇:go 簡易圖電話號碼識別插件(最後更新20101015)