[問題] 新手請教網站爬蟲用urllib會跑出亂碼

看板Python作者 (CurryIsGod)時間10年前 (2015/03/17 00:19), 編輯推噓1(105)
留言6則, 6人參與, 最新討論串1/1
大家好~ 我是新手想寫個網路爬蟲 用來爬中文下來 我是用urllib爬的 可是中文爬下來之後會呈現亂碼@@ 不知道為什麼QQ 沒有人可以問所以上來請教各位大大... -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 122.116.8.231 ※ 文章網址: https://www.ptt.cc/bbs/Python/M.1426522784.A.BDB.html

03/17 00:20, , 1F
用python2 寫的><
03/17 00:20, 1F

03/17 00:51, , 2F
編碼問題
03/17 00:51, 2F

03/17 02:52, , 3F
string = unicode(string)
03/17 02:52, 3F

03/17 12:02, , 4F
改用python3
03/17 12:02, 4F

03/17 12:26, , 5F
2 處理編碼很麻煩,改用 3 吧
03/17 12:26, 5F

04/27 06:18, , 6F
用scrapy比較簡單
04/27 06:18, 6F
文章代碼(AID): #1L1mAWlR (Python)
文章代碼(AID): #1L1mAWlR (Python)