閱讀820 返回首頁    go 火車采集器


火車頭通用OCR識別/驗證碼識別演示程序

火車頭通用OCR識別/驗證碼識別演示程序

作者:火車頭 發布於:2011-3-9 15:16 Wednesday 分類:其它資源



OCR識別在網站上廣泛用於小幅圖片的文本提取和驗證碼識別,以前很多識別程序都是基於特定網站,特定圖片進行特征碼分析。合肥樂維信息技術公司根據此前的技術積累,構架通用識別方案,做成此演示程序供大家測試。希望大家積極提供寶貴的測試意見,以便我們應用到軟件開發中,服務廣大站長。

 

該演示程序需要.net framework2.0 及支持 Microsoft Visual C++ 2008 SP1 Redistributable 支持。

.net framework2.0下載地址:
32位下載地址:https://download.microsoft.com/download/5/6/7/567758a3-759e-473e-bf8f-52154438565a/dotnetfx.exe
64位下載地址:https://download.microsoft.com/download/a/3/f/a3f1bf98-18f3-4036-9b68-8e6de530ce0a/NetFx64.exe


Visual C++ 2008 SP1 Redistributable:https://www.microsoft.com/downloads/zh-cn/details.aspx?FamilyID=a5c84275-3b97-4ab7-a40d-3802b2af5fc2


直接打開 LeWellOCR.exe 運行演示程序

1、從本地或者指定URL地址 打開需要識別的圖片
2、可選是否對圖片進行一些簡單的處理操作,如果需要請添加濾鏡對圖片進行去噪
3、設置白名單和黑名單字符串,即允許和不允許在結果中出現的字符串
4、開始測試識別!

內置了幾個基礎的測試樣式大家可以直接在項目中加載測試。

58同城驗證碼識別.xml,
454.cn驗證碼識別.xml,
ageow.com驗證碼識別.xml,
baike.sxlbl.com驗證碼識別.xml,
china.alibaba.com驗證碼識別.xml,
dfrxb.com驗證碼識別.xml,
hfzs.cn驗證碼識別.xml,
my.home.new.cn驗證碼識別.xml,
passport.cntv.cn驗證碼.xml,
pconline驗證碼.xml,
phone.10086.cn驗證碼識別.xml,
tongxue.com驗證碼識別.xml,
valve365.com驗證碼識別.xml,
口碑驗證碼識別.xml,
上海熱線圖片識別.xml 等。更多的大家可供試驗,成功識別的網站歡迎評論留言。

 

2011-03-21更新:我們已將該功能做成火車采集器的插件,可成功運用到火車采集器2010版中,旗艦版企業版用戶可以直接免費使用,請直接向您所屬客服索要該識別插件。 詳細內容見:  火車采集器通用OCR識別.NET插件(03-21更新



 


點擊查看原圖

點擊查看原圖

點擊查看原圖

 點擊查看原圖
點擊查看原圖 點擊查看原圖 點擊查看原圖

附件下載:
LeWellOCR.rar 3.21MB

標簽: 驗證碼識別 通用驗證碼識別 OCR驗證碼識別 通用OCR

相關日誌:

引爆雙十一,火車采集器買一送一 僅限當天!!

火車采集器V9助力大數據時代:抓住數據搶占機遇

需要登陸網站的采集方法(視頻教程)

V8方維分享係統發布擴展(最後更新2013.7.2)

使用分頁采集Qvod播放地址(語音教程,帶規則)

« 火車采集器二維碼識別插件,已增加V7版本 | 通用自動更新程序完成»

評論:

魚中魚
2012-05-28 10:02
要是能支持java調用就好了 。
www.rugu8.com
2011-04-23 15:56
看上去不錯~
luckfish
2011-03-30 20:21
測試了口碑的可以采集識別,58的調試了n遍,還是有錯誤,請問,這個58采集的配置文件調試好的,可以提供一份嗎?
56308168
2011-09-04 09:05
@luckfish:58圖片識別,因為圖片有一些幹擾,所以用這個識別軟件並不能保證100%正確率。如果需要100%正確率的采集規則,可以找我。
luckfish
2011-03-21 00:16
請教,這個如何結合火車頭采集圖片電話呢?
小文
2011-03-21 01:18
@luckfish:請查看這篇文章 https://board.locoy.com/?post=71
dff
2011-03-10 23:32
要是能采集阿裏的求購就更好了。
sunny
2011-03-09 16:36
謝謝,支持

發表評論:

最後更新:2017-05-09 01:05:56

  上一篇:go 論壇數據轉移專家Discuz!NT 3.6發布接口完成
  下一篇:go word文檔批量生成工具