[問題] OCR(光學辨識)推薦書籍或函式庫

看板CSSE (電腦科學及軟體工程)作者 (南洋大兜蟲)時間12年前 (2011/11/02 22:21), 編輯推噓2(201)
留言3則, 3人參與, 最新討論串1/4 (看更多)
有鑑於在像 komica 這類的討論版或論壇 回覆時都夾帶圖片,而圖片上常常會有字幕或者是漫畫角色的台詞,笑果十足 但是要蒐集這些東西其實很累,於是我有個 idea: 我打算實做一個 content based image search engine 對圖片上的文字,經過辨識之後做 indexing 如此只要把想要的話輸入進去,就可以找到任何相關動漫或電影台詞的引用圖片 (我 google 老半天發現這世界好像還沒有這樣的搜尋引擎,讓我更想做了) 我有IR背景知識,但對於圖形辨識完全不得其門而入 希望在圖形辨識上有經驗的人可以給我一些指引 我目前試過 tesseract, gocr 不過經過測試我發現他們似乎主力在「文件」,對於卡通圖片中的文字辨識能力薄弱 問題: 1. 對於我的需求,我要找得技術是 OCR 沒錯吧?或者我弄錯關鍵字了? 2. 如果關鍵字確實是 OCR,是否有其他適合辨識圖畫(非文件)的函式庫? 3. 接續 2,有什麼推薦的書籍,可以學習如何實做一個 OCR system 呢? 感激不盡^_^ PS. 這是自娛專案,有興趣參與的人也可來信 XD -- ※ 發信站: 批踢踢實業坊(ptt.cc) ◆ From: 140.113.246.1 ※ 編輯: tonytonyjan 來自: 140.113.246.1 (11/02 22:22)

11/02 22:55, , 1F
還蠻有趣的,要不要試試MODI這個library,不過要安裝OFFICE
11/02 22:55, 1F

11/02 23:01, , 2F
但我要跑在 UN*X Server上耶,這樣 MODI 沒問題嗎
11/02 23:01, 2F

11/03 01:03, , 3F
關鍵字:字幕辨識/擷取..
11/03 01:03, 3F
文章代碼(AID): #1EiL7VZ6 (CSSE)
文章代碼(AID): #1EiL7VZ6 (CSSE)