[問題] pyquery 解析 big5 網站發生問題
各位好今天寫爬蟲的時候遇到一個奇怪的問題
抓取與解析使用 python 2 的 urlib2 搭配 pyquery
一模一樣的程式碼在我的 ubuntu server 執行順利
但 centos server 就會中斷
為了抽絲剝繭直接把網頁存成檔案來 parser 的結果一樣
程式碼:
d = pq(response)
titles = d('td.list_proName')
for title in titles:
a = pq(title).find('a:first')
print(a.text())
-------------------------
ubuntu 16
python 2.17.2
pyquery 1.4.0
centos 7.6
python 2.17.5
pyquery 1.4.0
-------------------------
網址:
https://bre.is/fVLyR9i3J
執行上面的程式碼 ubuntu 順利跑出二十個名稱,而 centos 的結果是
理膚寶水身體濕潤霜 400ml 公司貨中文標 PG美妝
理膚寶水多容安極效舒緩修護精華乳潤澤型40ml 安膚霜 新效期 公司貨中文標 PG美妝
理膚寶水多容安清潔卸
不知道問題出在那邊
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 122.116.234.173
※ 文章網址: https://www.ptt.cc/bbs/Python/M.1556583866.A.CB4.html
Python 近期熱門文章
PTT數位生活區 即時熱門文章