[問題] Beautifulsoup的get_text()問題

看板Python作者 (謝謝你9527)時間9年前 (2016/01/30 10:45), 編輯推噓1(102)
留言3則, 3人參與, 最新討論串1/1
昨天用BeautifulSoup(BS)的get_text()成功抓取網頁資料 但是問題出現了 我抓的網站是簡體字網站 但是用get_text()抓出來的是像這樣的資料: b'/x56/x34/x49/x04' 我查看了一下他的資料型態是bytes 網頁的編碼是UTF-8 我電腦的預設編碼也是UTF-8 我想把這個資料轉成用原本的簡體字顯示 請問有辦法嗎? 感謝各位大神的幫忙! -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 111.82.222.141 ※ 文章網址: https://www.ptt.cc/bbs/Python/M.1454121918.A.4E3.html

01/30 17:47, , 1F
decode
01/30 17:47, 1F

01/30 21:42, , 2F
不過他內容前面有個b 需要把他變成u再decode嗎?
01/30 21:42, 2F

01/31 02:12, , 3F
b'...' 表示是 bytes,就直接 decode 不用什麼 u
01/31 02:12, 3F
文章代碼(AID): #1Mh2E-JZ (Python)
文章代碼(AID): #1Mh2E-JZ (Python)