[問題] 圖片辨識輸出文字

看板Python作者時間6年前 (2019/06/06 02:11), 6年前編輯推噓4(4014)
留言18則, 10人參與, 6年前最新討論串1/1
目前有乘客文件可以掃描成PDF檔案,想透過程式將身份字號轉譯成文字檔,該透過什麼方 法呢? 這方面有想過可能要透過智慧學習方式提高辨識度 -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 39.9.202.92 (臺灣) ※ 文章網址: https://www.ptt.cc/bbs/Python/M.1559758308.A.E46.html ※ 編輯: wii8898333 (39.9.202.92 臺灣), 06/06/2019 02:58:32

06/06 10:19, 6年前 , 1F
找ocr api
06/06 10:19, 1F

06/06 12:54, 6年前 , 2F
orc辨識度太低怎麼辦呢
06/06 12:54, 2F

06/06 15:09, 6年前 , 3F
找足夠的 dataset 自己 train 一個
06/06 15:09, 3F

06/06 15:09, 6年前 , 4F
問題就在於你有沒有足夠的 data 給他 train,還有你會不會
06/06 15:09, 4F

06/06 15:09, 6年前 , 5F
train…
06/06 15:09, 5F

06/06 16:51, 6年前 , 6F
除非辨識率100% 不然到時候你還不是要人工比對一次? 身分
06/06 16:51, 6F

06/06 16:51, 6年前 , 7F
證字號可以錯喔?
06/06 16:51, 7F

06/06 16:55, 6年前 , 8F
用時新找個工讀抄寫就好 要辨識做啥? 有比較省時便宜又正
06/06 16:55, 8F

06/06 16:55, 6年前 , 9F
確?
06/06 16:55, 9F

06/06 16:56, 6年前 , 10F
^時薪
06/06 16:56, 10F

06/06 17:44, 6年前 , 11F
想玩機器學習先叫老闆給資料 不然就是做不到
06/06 17:44, 11F

06/06 20:27, 6年前 , 12F
身分證資料多少算是可以錯的? 畢竟有驗證碼欄位
06/06 20:27, 12F

06/06 20:29, 6年前 , 13F
資料的話 應該已經算是很好自行產生的了
06/06 20:29, 13F

06/06 23:06, 6年前 , 14F
手寫還是印刷的字?
06/06 23:06, 14F

06/07 06:37, 6年前 , 15F
印刷
06/07 06:37, 15F

06/07 07:17, 6年前 , 16F
印刷的 tesseract 就行了 畫值不要太低的話
06/07 07:17, 16F

06/07 16:02, 6年前 , 17F
買個專業的 OCR 軟體來辨識比較實在一些
06/07 16:02, 17F

06/08 00:57, 6年前 , 18F
印刷的用tesseract去串接就好.....
06/08 00:57, 18F
文章代碼(AID): #1S-0Nav6 (Python)
文章代碼(AID): #1S-0Nav6 (Python)