阅读154 返回首页    go 火车采集器


Html实体字符转换

Html实体字符转换

作者:小文 发布于:2010-8-28 12:45 Saturday 分类:其它资源

有时,我们采集的数据类似 "你好", 这些字符在源代码中是这个样子,但在网页中确是正常显示为中文.这类代码叫做html实体 ,我们可以通过PHP的内置函数,对其进行转换,以方便查阅.

php代码如下:

echo mb_convert_encoding("你好", "gb2312", "HTML-ENTITIES"); //输出:你好

mb_convert_encoding 用法可以参考https://cn.php.net/manual/zh/function.mb-convert-encoding.php

如果您使用php插件,可能需要添加 php_mbstring.dll 扩展.火车采集器中PHP插件的扩展添加方法请查看文章 https://board.locoy.com/?post=34

标签: php插件 html实体字符

相关日志:

引爆双十一,火车采集器买一送一 仅限当天!!

火车采集器V9助力大数据时代:抓住数据抢占机遇

需要登陆网站的采集方法(视频教程)

V8方维分享系统发布扩展(最后更新2013.7.2)

使用分页采集Qvod播放地址(语音教程,带规则)

« PHP对escape的字符串进行解密 | 火车采集器2010版PHP插件增加扩展的方法»

评论:

gucci
2010-10-10 14:17
我想问问,&#20320 这些字符的转换,火车能否提供一个工具?我发现用这些字符做伪原创,效果很好,引擎也能识别。
小文
2010-10-10 15:18
@gucci:这种的话可以实现,使用插件就可以了.

发表评论:

最后更新:2017-05-09 01:05:53

  上一篇:go 重新安装MDAC的方法
  下一篇:go 标签间调用功能完成