閱讀154 返回首頁    go 火車采集器


Html實體字符轉換

Html實體字符轉換

作者:小文 發布於:2010-8-28 12:45 Saturday 分類:其它資源

有時,我們采集的數據類似 "你好", 這些字符在源代碼中是這個樣子,但在網頁中確是正常顯示為中文.這類代碼叫做html實體 ,我們可以通過PHP的內置函數,對其進行轉換,以方便查閱.

php代碼如下:

echo mb_convert_encoding("你好", "gb2312", "HTML-ENTITIES"); //輸出:你好

mb_convert_encoding 用法可以參考https://cn.php.net/manual/zh/function.mb-convert-encoding.php

如果您使用php插件,可能需要添加 php_mbstring.dll 擴展.火車采集器中PHP插件的擴展添加方法請查看文章 https://board.locoy.com/?post=34

標簽: php插件 html實體字符

相關日誌:

引爆雙十一,火車采集器買一送一 僅限當天!!

火車采集器V9助力大數據時代:抓住數據搶占機遇

需要登陸網站的采集方法(視頻教程)

V8方維分享係統發布擴展(最後更新2013.7.2)

使用分頁采集Qvod播放地址(語音教程,帶規則)

« PHP對escape的字符串進行解密 | 火車采集器2010版PHP插件增加擴展的方法»

評論:

gucci
2010-10-10 14:17
我想問問,&#20320 這些字符的轉換,火車能否提供一個工具?我發現用這些字符做偽原創,效果很好,引擎也能識別。
小文
2010-10-10 15:18
@gucci:這種的話可以實現,使用插件就可以了.

發表評論:

最後更新:2017-05-09 01:05:53

  上一篇:go 重新安裝MDAC的方法
  下一篇:go 標簽間調用功能完成