Re: [問題] OCR（光學辨識）推薦書籍或函式庫

看板CSSE (電腦科學及軟體工程)作者tonytonyjan (南洋大兜蟲)時間14年前 (2011/11/09 00:46)推噓0(0推 0噓 0→)

留言0則, 0人參與討論串4/4 (看更多)

感謝你導正了我一個重要的觀念因為我一直以為 OCR 其實包含了 text detection 既然已經知道了關鍵字，就容易多了我也確實在 google scholar 找到很多我需要的論文萬分的感謝，你幫我省下了很多時間= ) m(_ _)m ---編輯--- 我後來在 stack overflow 找到這個帖子 http://stackoverflow.com/questions/880438/text-detection-location-libraries 和我的問題很像，回答中也意外找到了一個開源軟體： https://sourceforge.net/projects/tirg/ 意外符合我要的東西啊XD ※ 引述《vgod (single)》之銘言： : 這問題要拆成兩部分來看, 第一是text detection, 在任意圖上找出文字的位置 : 第二是text recognition, 給定圖和文字區塊的位置, 輸出文字字串 : 第一個問題有很多種演算法, 要看你圖的性質而決定要用哪種 : 如果能知道文字的位置後, 接下來其實就比較簡單, : 因為第二個問題可以直接用現成的OCR引擎加上一些image processing來處理 : 最容易取得的OCR引擎是Tesseract, 3.0後還支援包含中文在內的多國語言 : 但如你所說, OCR引擎大多是假設圖片是白底黑字的文件 : 所以直接把有複雜背景的圖片丟進去是不行的 : 最簡單的處理方法就是用一些影像處理的演算法把背景去掉, 然後轉成白底黑字的樣子 : 這樣再丟進OCR引擎的結果就會好很多 : 基本概念是這樣, 關鍵字也都在上面了, : 如果能看英文論文的話, 在google scholar能找到非常多資料 -- ※ 發信站: 批踢踢實業坊(ptt.cc) ◆ From: 140.113.246.1 ※ 編輯: tonytonyjan 來自: 140.113.246.1 (11/09 02:04)