[問題] python 爬蟲遇到big5擴充字亂碼
大家好,又上來打擾了,最近在爬蟲的時候遇到這個詞:
"宏碁電腦",發現爬下來時候會變成亂碼,
https://imgur.com/ZSV4gAe
![](https://i.imgur.com/ZSV4gAe.jpg)
經爬文查詢後發現這樣的問題:
https://blog.hoamon.info/2008/05/python-big5.html
不過該解法似乎不能應用在python3.7
想問一下有沒有類似的情況該怎麼解@@?
補上網站:
https://tw.stock.yahoo.com/news/%E5%A4%96%E8%B3%87-%E8%B3%A3%E8%B6%85%E8%82%A1-%E5%AE%8F-%E7%A2%81-%E9%B4%BB-234706227.html
程式碼:
import requests
from bs4 import BeautifulSoup
url='https://tw.stock.yahoo.com/news/%E5%A4%96%E8%B3%87-%E8%B3%A3%E8%B6%85%E8%82%A1-%E5%AE%8F-%E7%A2%81-%E9%B4%BB-234706227.html'
req=requests.get(url)
bs=BeautifulSoup(req.text,'html.parser')
print(bs.find('h1').text)
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 220.133.44.129
※ 文章網址: https://www.ptt.cc/bbs/Python/M.1543208095.A.47E.html
→
11/26 13:20,
6年前
, 1F
11/26 13:20, 1F
→
11/26 13:21,
6年前
, 2F
11/26 13:21, 2F
→
11/26 13:22,
6年前
, 3F
11/26 13:22, 3F
※ 編輯: pig98520 (220.133.44.129), 11/26/2018 13:29:53
推
11/26 13:39,
6年前
, 4F
11/26 13:39, 4F
→
11/26 14:55,
6年前
, 5F
11/26 14:55, 5F
推
11/26 15:21,
6年前
, 6F
11/26 15:21, 6F
→
11/26 17:05,
6年前
, 7F
11/26 17:05, 7F
推
11/26 19:35,
6年前
, 8F
11/26 19:35, 8F
→
11/26 20:08,
6年前
, 9F
11/26 20:08, 9F
→
11/27 10:27,
6年前
, 10F
11/27 10:27, 10F
Python 近期熱門文章
PTT數位生活區 即時熱門文章