[問題] 爬蟲 jsp網頁 亂碼
大家好
這幾天再爬一個jsp的網頁
但爬到的內容中文部分都是亂碼
不管我怎樣編譯都沒辦法辨識(轉utf-8)
我在想是不是jsp的編碼比較特別?
大概長這樣
ªZc ÷ºXÄ¥c ±
我爬了一堆文,想破頭也對python的編碼快搞混了
想請大家幫忙想想,不知道問題是出在哪一段上
如果是用瀏覽器看網頁是正常中文的
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 114.25.210.41
※ 文章網址: https://www.ptt.cc/bbs/Python/M.1457960608.A.4CB.html
→
03/14 21:17, , 1F
03/14 21:17, 1F
→
03/14 21:31, , 2F
03/14 21:31, 2F
→
03/14 21:31, , 3F
03/14 21:31, 3F
→
03/15 13:06, , 4F
03/15 13:06, 4F
→
03/15 13:07, , 5F
03/15 13:07, 5F
→
03/15 13:07, , 6F
03/15 13:07, 6F
→
03/15 13:07, , 7F
03/15 13:07, 7F
→
03/15 13:08, , 8F
03/15 13:08, 8F
→
03/15 13:09, , 9F
03/15 13:09, 9F
→
03/17 00:42, , 10F
03/17 00:42, 10F
→
03/17 00:43, , 11F
03/17 00:43, 11F
Python 近期熱門文章
PTT數位生活區 即時熱門文章