阅读144 返回首页    go 火车采集器


使用插件配合采集器过滤不需要的数据(PHP)

使用插件配合采集器过滤不需要的数据(PHP)

作者:小文 发布于:2010-10-26 9:12 Tuesday 分类:免费插件

有时我们需要对采集的内容长度进行限制.比如标题长度不得小于3大于20,并且不能包含某些字符串.我们可以在插件中写相关的代码,将采集的数据清设置为空,然后在采集器的标签设置中,设置该标签内容不得为空,然后在系统设置中设置内容不符合时删除记录,就可以快速的将不需要的代码删除掉了.以后是PHP的示例代码.

<?php
if(array_key_exists('标题',$LabelArray))
{
    $title=$LabelArray['标题'];
    if(strlen($title)<3||strlen($title)>20||strpos($title,'╩')!==false) $LabelArray['标题']='';
}

echo serialize($LabelArray);
?>

相关日志:

火车采集器伪原创插件V9版

单条记录下载文件名加自增ID

火车采集器二维码识别插件,已增加V7版本

jin11颜色尺码获取插件

百度相关搜索插件V7版(最后更新2012.11.23)

« 火车采集器2011目标 | 新浪微博评论及转发数采集插件(C#)»

发表评论:

最后更新:2017-05-09 01:05:54

  上一篇:go 使用Post方法采集获取网址列表(2010.11.16)
  下一篇:go 简易图电话号码识别插件(最后更新20101015)