[軟體] PDF文字辨識(OCR) 有推薦的軟體嗎?

看板MAC (蘋果Mac)作者 (我要什麼?)時間7年前 (2018/01/16 18:01), 編輯推噓5(5026)
留言31則, 9人參與, 7年前最新討論串1/1
小弟時常會下載學術文獻pdf檔 在mac上或是iPad上閱讀 許多比較古老的文獻 似乎都是掃描檔 看起來都是文字 但是無法選取文字 (被視為"圖片"的樣子) 所以在閱讀pdf時 無法畫重點 需求: 將PDF中的文字變成可以選取跟搜尋 已試過: Adobe Acrobat 可以達到我的需求, 但是....它好貴Orz 所以我想問問有沒有其他推薦的軟體? 要付費購買沒關係 希望比較便宜點就好 已經google過, 找到許多pdf文字辨識的線上服務 但都是將pdf轉換成word檔或是txt檔 我希望的是維持pdf檔, 而且不要改變文章的字體格式外貌等等 只是純粹將內文變成可以選取以及搜尋 請問有推薦的軟體嗎? -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 114.25.7.61 ※ 文章網址: https://www.ptt.cc/bbs/MAC/M.1516096873.A.453.html

01/16 18:13, 7年前 , 1F
先把 PDF 檔匯出成圖片檔,再用 OneNote 擷取看看?(之
01/16 18:13, 1F

01/16 18:13, 7年前 , 2F
前用手機拍照再擷取有成功,這樣也沒更改到原始檔的格式
01/16 18:13, 2F

01/16 18:16, 7年前 , 3F
01/16 18:16, 3F

01/16 18:27, 7年前 , 4F
感謝yh大回覆 我有試過OneNote 但它好像是把文字擷取
01/16 18:27, 4F

01/16 18:27, 7年前 , 5F
出來在旁邊 而不是直接把原始pdf檔裡的文字變得可選取
01/16 18:27, 5F

01/16 18:28, 7年前 , 6F
不知道是不是我使用方式錯誤?
01/16 18:28, 6F

01/16 18:29, 7年前 , 7F
我不是要把pdf檔裡的文字抓出來而已 通常抓出來也沒用
01/16 18:29, 7F

01/16 18:30, 7年前 , 8F
因為我看的文獻都夾雜很多數學符號式子 通常那些被抓出
01/16 18:30, 8F

01/16 18:30, 7年前 , 9F
來後都會亂七八糟無法閱讀.....
01/16 18:30, 9F

01/16 18:35, 7年前 , 10F
數學式更難了吧……
01/16 18:35, 10F

01/16 18:52, 7年前 , 11F
畫線改用方框 搜尋就沒辦法了 OCR麻煩
01/16 18:52, 11F

01/16 18:52, 7年前 , 12F
沒有什麼無腦方便的作法
01/16 18:52, 12F

01/16 19:14, 7年前 , 13F
Ocrkit
01/16 19:14, 13F

01/16 20:04, 7年前 , 14F
數學式還沒看過可以完美ocr的@@
01/16 20:04, 14F

01/16 21:01, 7年前 , 15F
太難...你有錢可能還找不到人幫你做
01/16 21:01, 15F

01/16 21:01, 7年前 , 16F
現在的技術頂多就轉成文字而已 要維持排版..
01/16 21:01, 16F

01/16 21:02, 7年前 , 17F
還有數學符號 那應該無解了 可能連轉成text都無法
01/16 21:02, 17F

01/16 21:04, 7年前 , 18F
你可以試試找高手 http://cat.prhlt.upv.es/mer/
01/16 21:04, 18F

01/16 21:05, 7年前 , 19F
但是我估起碼5~10萬起跳
01/16 21:05, 19F

01/16 21:07, 7年前 , 20F
都有Adobe Acrobat了 有需求就買下去吧
01/16 21:07, 20F

01/16 22:21, 7年前 , 21F
如果是英文的話 把圖片上傳google雲端 然後用文件方式開啟
01/16 22:21, 21F

01/16 23:21, 7年前 , 22F
Qa大大說的方法我也試過 但是google文件開啟後就不再是
01/16 23:21, 22F

01/16 23:21, 7年前 , 23F
pdf檔了 那也是把文字擷取出來另外變成word檔
01/16 23:21, 23F

01/16 23:26, 7年前 , 24F
vi大 所以我要的並不是把pdf內容抓出來另存成文字檔啊
01/16 23:26, 24F

01/16 23:27, 7年前 , 25F
那樣抓出來一定會亂 數學符號多半也抓不太出來
01/16 23:27, 25F

01/16 23:27, 7年前 , 26F
我只是希望pdf內容的文字(夾雜數學)變得可以選取就好
01/16 23:27, 26F

01/16 23:28, 7年前 , 27F
Adobe Acrobat的確可以做到我要的 不過實在很貴
01/16 23:28, 27F

01/16 23:28, 7年前 , 28F
所以我才想問問有無其他能達到近似效果的軟體
01/16 23:28, 28F

01/17 00:08, 7年前 , 29F
remin大說的Ocrkit 好像可以做到Adobe Acorbat的效果!
01/17 00:08, 29F

01/17 00:08, 7年前 , 30F
也比較便宜 感謝!
01/17 00:08, 30F

01/17 01:14, 7年前 , 31F
放到evernote裡面?
01/17 01:14, 31F
文章代碼(AID): #1QNSrfHJ (MAC)
文章代碼(AID): #1QNSrfHJ (MAC)