閱讀486 返回首頁    go 微軟 go windows


關於圖像識別,我們是否可以用一種編程語言來描述?

今天在整理照片時,發現有張圖片上拍了一個表格,手動將內容抄寫下來不太省力,於是想如果有一個軟件可以抓取圖像中的表格文字該多好。。。

 

從頭設計一套軟件完成這個工作量有點大,想到已經有了一些手寫體識別的應用,隻要在該技術基礎上再增加一層接口,其實就能完成上述任務。

 

該接口要靈活,能夠適應各種應用的文字識別,比如漢字手寫體,英文手寫體,宋體,以及上麵的表格內容識別。因為一幅圖像中的內容是千差萬別的,我們可以借助一種圖像描述原語(Image Description Primitives, IDP)來完成這些內容的區別。

 

假設有如下IDP:

 

Def "Table"  p1;   //表示該圖像中有一個表格,聲明為對象p1

Set Origin(x0,y0);     //表示表格的左上角像素坐標

Set End(x1,y1);        //表示表格的右下角像素坐標

p1.cols = [5-10];       //表示該表格的列數可能在5~10列之間

p1.rows = [100-200];    //行數在100~200行之間

 

Table tb = p1.GetContent();     //創建表格對象,從p1對象中抽取內容,以字符串形式存入tb中

//打印輸出字符串

for(int i = 0;i<tb.rows;i++)

{

    for(int j = 0;j<tb.cols;j++)

    {

         printf("%s\t",tb[i][j]);

    }

    printf("\r\n");

}

End p1;       //銷毀對象

 

 

除了表格對象,我們還可創建純文本對象,手寫體對象,英文手寫體對象等,識別原語都封裝到p1.GetContent()中。

 

隻是一時想到的,不知有沒有價值。本人隻是對文字識別感興趣,沒有相關經驗,一家之言,歡迎討論。

最後更新:2017-04-03 14:53:50

  上一篇:go 網絡子係統72_IP多播地址與MAC多播地址的映射關係
  下一篇:go Struts2中的&lt;s:action&gt;標簽