Re: [問題] OCR(光學辨識)推薦書籍或函式庫

看板CSSE (電腦科學及軟體工程)作者 (single)時間13年前 (2011/11/08 12:47), 編輯推噓9(900)
留言9則, 9人參與, 最新討論串3/4 (看更多)
這問題要拆成兩部分來看, 第一是text detection, 在任意圖上找出文字的位置 第二是text recognition, 給定圖和文字區塊的位置, 輸出文字字串 第一個問題有很多種演算法, 要看你圖的性質而決定要用哪種 如果能知道文字的位置後, 接下來其實就比較簡單, 因為第二個問題可以直接用現成的OCR引擎加上一些image processing來處理 最容易取得的OCR引擎是Tesseract, 3.0後還支援包含中文在內的多國語言 但如你所說, OCR引擎大多是假設圖片是白底黑字的文件 所以直接把有複雜背景的圖片丟進去是不行的 最簡單的處理方法就是用一些影像處理的演算法把背景去掉, 然後轉成白底黑字的樣子 這樣再丟進OCR引擎的結果就會好很多 基本概念是這樣, 關鍵字也都在上面了, 如果能看英文論文的話, 在google scholar能找到非常多資料 ※ 引述《tonytonyjan (南洋大兜蟲)》之銘言: : 我把我的問題貼在 Komica 得到的回覆貼在這裡與大家分享: : 無名氏: 這應該偏影像辨識的學門了 之前是有玩face Detection (rpJRwjDA 11/11/03 : 07:12) : 無名氏: 不過那是辨識人臉的 (rpJRwjDA 11/11/03 07:12) : 無名氏: 文字辨識英文的話到還好,如果你要做中文的。我想你會做到死.......... : (aOLUs/V6 11/11/03 10:36) : 無名氏: 中文光是常用的字,少說有5千字....... (aOLUs/V6 11/11/03 10:37) : 無名氏: 不然就是要找人家做好的來套用了 (aOLUs/V6 11/11/03 10:38) : 無標題 名稱: 無名氏 [11/11/03(四)01:01 ID:jIVsifTM] No.6783 推 : 雖然我對OCR不熟,不過這個東西的確就是你的方向。 : 類似的應該還有車牌辨識/CAPTCHA破解之類的。 : 提到CAPTCHA破解我倒記得有一個很有趣的例子, : 使用JavaScript實作類神經網路來破驗證碼。 : http://ejohn.org/blog/ocr-and-neural-nets-in-javascript/ : 或許你也可以從這方面下手。 : 無標題 名稱: 無名氏 [11/11/03(四)07:36 ID:OK9R6lHk] No.6784 推 : http://www.google.com/insidesearch/searchbyimage.html : 無標題 名稱: 無名氏 [11/11/03(四)16:56 ID:a.T6EASg] No.6786 推 : Google image search 是 content based 沒錯,但是和原 PO 的需求不同吧? : ※ 引述《tonytonyjan (南洋大兜蟲)》之銘言: : : 有鑑於在像 komica 這類的討論版或論壇 : : 回覆時都夾帶圖片,而圖片上常常會有字幕或者是漫畫角色的台詞,笑果十足 : : 但是要蒐集這些東西其實很累,於是我有個 idea: : : 我打算實做一個 content based image search engine : : 對圖片上的文字,經過辨識之後做 indexing : : 如此只要把想要的話輸入進去,就可以找到任何相關動漫或電影台詞的引用圖片 : : (我 google 老半天發現這世界好像還沒有這樣的搜尋引擎,讓我更想做了) : : 我有IR背景知識,但對於圖形辨識完全不得其門而入 : : 希望在圖形辨識上有經驗的人可以給我一些指引 : : 我目前試過 tesseract, gocr : : 不過經過測試我發現他們似乎主力在「文件」,對於卡通圖片中的文字辨識能力薄弱 : : 問題: : : 1. 對於我的需求,我要找得技術是 OCR 沒錯吧?或者我弄錯關鍵字了? : : 2. 如果關鍵字確實是 OCR,是否有其他適合辨識圖畫(非文件)的函式庫? : : 3. 接續 2,有什麼推薦的書籍,可以學習如何實做一個 OCR system 呢? : : 感激不盡^_^ : : PS. : : 這是自娛專案,有興趣參與的人也可來信 XD -- ※ 發信站: 批踢踢實業坊(ptt.cc) ◆ From: 128.30.86.53

11/08 13:47, , 1F
有神快拜
11/08 13:47, 1F

11/08 16:10, , 2F
有神快拜
11/08 16:10, 2F

11/08 17:23, , 3F
11/08 17:23, 3F

11/09 01:03, , 4F
驚!原來你是 SIKULI 的作者,有神快拜!m()m
11/09 01:03, 4F

11/09 01:10, , 5F
V神!快拜!
11/09 01:10, 5F

11/10 12:47, , 6F
有神快拜!!!
11/10 12:47, 6F

11/12 14:47, , 7F
有神快拜!
11/12 14:47, 7F

12/10 01:20, , 8F
有神快拜!
12/10 01:20, 8F

12/15 02:39, , 9F
有神快拜!
12/15 02:39, 9F
文章代碼(AID): #1EkBHg3R (CSSE)
文章代碼(AID): #1EkBHg3R (CSSE)