[問題] Unicode Decode Error
我寫了一個crawler爬網頁
http://pastie.org/9682499#16,18
按照view page source <meta content="text/html; charset=Big5">
我用Big5 解碼回傳的 byte string
Python卻回應某些byte無法解碼
UnicodeDecodeError: 'big5' codec can't decode byte 0x82 in position 983:
illegal multibyte sequence
1
瀏覽器也是設定Big5解碼
那為什麼瀏覽器可以正確的顯現所有內容?
2
我試著用utf8瞎猜去解碼,一樣有error
請問我該如何處理這個錯誤而能顯示我所抓下來的網頁?
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 76.169.54.91
※ 文章網址: http://www.ptt.cc/bbs/Python/M.1414560558.A.9C4.html
→
10/29 13:41, , 1F
10/29 13:41, 1F
已補上
※ 編輯: suhang (76.169.54.91), 10/29/2014 14:08:00
推
10/29 14:56, , 2F
10/29 14:56, 2F
→
10/29 14:57, , 3F
10/29 14:57, 3F
→
10/29 14:57, , 4F
10/29 14:57, 4F
→
10/29 15:17, , 5F
10/29 15:17, 5F
→
10/29 16:00, , 6F
10/29 16:00, 6F
Python 近期熱門文章
PTT數位生活區 即時熱門文章