[請問] 抽出PDF內嵌的字體

看板EZsoft (小軟體)作者 (霹靂狗)時間14年前 (2011/10/13 23:29), 編輯推噓2(207)
留言9則, 6人參與, 最新討論串1/1
請教,最近遇到一份棘手的PDF電子檔 http://ishare.iask.sina.com.cn/f/14375446.html 應該是為了防止複製所動的手腳 也就是內嵌的字體,是系統沒有的字體,而且字體包了300多個 蠻好奇是哪套工具,可以做出這種機制的保護 另外想到的解決方法,除了OCR還想到抽取裡面300多個字體出來 但爬了許久好像還沒看到這種工具 另外,透過Foxit PDF Editor直接改原始檔的字體也不能改 這種保護應該算跟內文本身就是圖片同樣難搞 謝謝 -- ※ 發信站 :批踢踢實業坊(ptt.cc) ◆ From: 59.104.201.196

10/13 23:50, , 1F
很有趣的保護。裏面的字型內碼和顯示出來的字不一樣。
10/13 23:50, 1F

10/13 23:52, , 2F
像 b 這個字,copy 出來變成 F。
10/13 23:52, 2F

10/13 23:53, , 3F
這樣電子書就不能搜尋,等於癈了一半功夫。
10/13 23:53, 3F

10/14 00:12, , 4F
o大要傳授一半功夫治療PDF嗎? OCR是最終療法 XD
10/14 00:12, 4F

10/15 08:29, , 5F
把他轉成word 看看
10/15 08:29, 5F

10/15 19:24, , 6F
轉成word狀況一樣 因為還是沒字型可以對應
10/15 19:24, 6F

10/16 10:47, , 7F
原文書耶,好久沒看到了
10/16 10:47, 7F

10/18 01:34, , 8F
字形替換就無解了啦 整個都亂掉了 不可逆的替換
10/18 01:34, 8F

10/18 20:29, , 9F
找一台夠能出取字體的掃描機...
10/18 20:29, 9F
文章代碼(AID): #1EbmFfPr (EZsoft)
文章代碼(AID): #1EbmFfPr (EZsoft)