355
搜狐
规则配置__舆情分析_快速开始_公众趋势分析-阿里云
配置好专题及关键词后,如果抓取的内容太多怎么办?其中一个办法是通过设置“过滤规则”来对抓取内容进行过滤。满足定义好的过滤规则的内容将不再抓取。
1、添加过滤规则
在控制台首页,点击左边菜单“后台管理—规则配置”即进入规则管理界面,默认是打开“过滤规则”管理界面。顶部有个重要选项“是否跳过垃圾箱”建议“开启”,即过滤的内容是否进去垃圾箱,如果开启,则过滤内容不进去垃圾箱,则不消耗推送舆情配额。
点击”添加规则”按钮,即可按关键词、反馈名/源站名称、网站URL来进行规则设定。如下图:
“规则”需要根据下面的“过滤类型”来填写不同的内容,关键词是针对抓取的文本内容来过滤的,中“反馈名/源站名称”则是针对抓取文本所属站点名称来过滤的,如“网易娱乐”、“微博”、“Techweb”,“网站url”则是针对抓取的站点url来过滤的,如m.techweb.com.cn。
填写“规则”需学习下面几点:
a、规则可以直接写关键字进行匹配,示例:搜索 。会把包含”搜索“的内容进行匹配
b、多个关键字同时匹配请用 AND (注意前后有空格)来连接,表示且的逻辑:同时包含多个关键词才进行匹配。示例:搜索 AND 店铺,会把同时包含搜索+店铺的内容进行匹配
c、匹配任意一个关键字用 , (英文的逗号)或者 OR (注意前后有空格)来连接。如:搜索,找不到。表示匹配到”搜索”或者”找不到”的内容。
d、支持括号。示例:(搜索 OR 找不到) AND 店铺。会匹配包含”店铺“并且”搜索“的内容 或者 包含”店铺“并且”找不到“的内容。
e、支持不包含,只需要在不包含词加英文感叹号。示例:!淘宝 AND 阿里。会匹配包含“阿里”并且不包含“淘宝”的内容。
f、规则支持正则表达式,只需要在规则前增加RE(空格),示例1: RE ^w+$,表示对纯数字/英文的内容进行匹配。示例2:RE^[sS]{0,5}$,表示对小于5个字符的内容进行匹配
2、编辑&删除过滤规则
每条规则的右侧都有“编辑”及“删除”按钮,按步骤操作即可。
标签规则
配置好专题及关键词后,想对抓取的内容建立多层级的知识结构,则可以使用“标签规则”来实现。
1、添加标签规则
在控制台首页,点击左边菜单“后台管理—规则配置”即进入规则管理界面,默认是打开“过滤规则”,点击tab”标签规则”按钮进入标签规则管理界面,在这里可以建立针对抓取内容的多级标签。标签包括“根标签”和“子标签”根标签:最顶级的标签,它上面没有比它更大的标签,子标签:附着在某一标签下面的标签。如下图,针对“iPhone7”这个关键词抓取的内容,想从“新功能”“性价比”两方面来归类,且“新功能”关注了电池、耳机、屏幕等:在“添加标签规则”界面需要输入自定义的标签名称及规则(多个关键词组合),填写注意事项同上“过滤规则”。
2、编辑&删除标签规则
鼠标选中每条标签,即可呼出“添加下一级标签”、“编辑”及“删除”按钮,按步骤操作即可。标签被编辑修改之后,大约过2分钟之前打过舆情的标签会很快修改。
最后更新:2016-11-24 11:23:49
上一篇:
图表分析__舆情分析_快速开始_公众趋势分析-阿里云
下一篇:
报警配置__舆情分析_快速开始_公众趋势分析-阿里云
云服务器 ECS Linux SSH 无法远程登录问题排查指引__远程登录 (SSH)_Linux操作运维问题_云服务器 ECS-阿里云
如何设置域名隐私保护服务?__域名安全_管理操作_域名-阿里云
获取应用列表__应用管理类 API_Open API 参考_企业级分布式应用服务 EDAS-阿里云
推送消息给android__API列表_OpenAPI 1.0_移动推送-阿里云
主机新手使用指南__管理控制台_使用指南_云虚机主机-阿里云
变更配置__购买指南_云数据库 RDS 版-阿里云
步骤 1:购买 Linux 实例__搭建 WordPress 网站_建站教程_云服务器 ECS-阿里云
基本参数__图片水印_老版图片服务手册_对象存储 OSS-阿里云
1.1 开通分析型数据库服务__快速入门_分析型数据库-阿里云
ReservedThroughputDetails__DataType_API 参考_表格存储-阿里云
相关内容
常见错误说明__附录_大数据计算服务-阿里云
发送短信接口__API使用手册_短信服务-阿里云
接口文档__Android_安全组件教程_移动安全-阿里云
运营商错误码(联通)__常见问题_短信服务-阿里云
设置短信模板__使用手册_短信服务-阿里云
OSS 权限问题及排查__常见错误及排除_最佳实践_对象存储 OSS-阿里云
消息通知__操作指南_批量计算-阿里云
设备端快速接入(MQTT)__快速开始_阿里云物联网套件-阿里云
查询API调用流量数据__API管理相关接口_API_API 网关-阿里云
使用STS访问__JavaScript-SDK_SDK 参考_对象存储 OSS-阿里云