[問題] pip install pdfplumber遇到encoding問題

看板Python作者 (14號星期五的傑森)時間4年前 (2020/11/18 15:17), 4年前編輯推噓2(209)
留言11則, 4人參與, 4年前最新討論串1/1
因工作需求 需要用讀取pdf上的表格 雖然試用過tabula,但其顯現的效果不太好 所以想嘗試換用pdfplumber 但在pip install pdfplumber的過程中遇到ERROR 看起來是UniDecodeError的問題 'cp950' codec can't decode byte 0xe2 in position 4981: illegal multibyte sequence 不知道如何pip 的時候解決這個問題..... 另外我的PYTHON是3.8 雖然上網GOOGLE過相關辦法 sys.setdefaultencoding("utf-8") 但上述辦法似乎在好幾個版本前就被拿掉 所以還想請問版上大大有成功安裝過pdfplumber的經驗分享 或我該如何解決這個問題 或是面臨稍微有點複雜的pdf表格,該如何讀取 說是複雜,其實他就是沒有明確的表格 只用空格來區隔 所以導致我用tabula時候會某A欄的資料跑到隔壁欄去 先謝謝願意看到這邊了解我問題的版友們 -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 61.228.220.91 (臺灣) ※ 文章網址: https://www.ptt.cc/bbs/Python/M.1605683838.A.9B2.html

11/18 16:30, 4年前 , 1F
pip install UnicodeDecodeError #304
11/18 16:30, 1F

11/18 16:31, 4年前 , 2F
pdfplumber 的 bug, 才剛修
11/18 16:31, 2F
我剛有看了一下你說的那篇,他看起來5天前修好這個 但我今天安裝時候還是有問題.. 還是我應該退到3.7去安裝才行? ※ 編輯: jasonhsu14 (220.135.101.201 臺灣), 11/18/2020 19:46:30

11/18 21:14, 4年前 , 3F
我Python是3.7.4 pdfplumber是0.5.21裝的時候沒有問
11/18 21:14, 3F

11/18 21:16, 4年前 , 4F
題 之前要轉表格寫了個小工具可以給你參考
11/18 21:16, 4F

11/18 21:16, 4年前 , 5F
先謝謝樓上兩位回答 我Python3.8.3,後來改安裝0.5.21的版本是OK的 至於最新版的....我還是會出現UnicodeError錯誤QQ ※ 編輯: jasonhsu14 (61.228.220.91 臺灣), 11/19/2020 09:06:09

11/19 17:47, 4年前 , 6F
Windows? 試試這篇 https://bit.ly/32ZNPul
11/19 17:47, 6F

11/19 17:47, 4年前 , 7F
下載後修改 setup.py 再用 pip 安裝
11/19 17:47, 7F

11/21 15:16, 4年前 , 8F
嗯...以前我會叫你去改安裝源碼,現在我會叫你用docker或是
11/21 15:16, 8F

11/21 15:16, 4年前 , 9F
wsl2
11/21 15:16, 9F

11/21 15:18, 4年前 , 10F
然後win10 20H1以上應該在語言選項有一個使用unicode的beta
11/21 15:18, 10F

11/21 15:18, 4年前 , 11F
功能可以試試
11/21 15:18, 11F
文章代碼(AID): #1VjCf-co (Python)
文章代碼(AID): #1VjCf-co (Python)