看板 [ Python ]
討論串[問題] 抓取雅虎新聞
共 2 篇文章
首頁
上一頁
1
下一頁
尾頁

推噓1(1推 0噓 0→)留言1則,0人參與, 最新作者shadowjohn (轉角遇到愛)時間9年前 (2016/12/21 09:04), 9年前編輯資訊
0
0
7
內容預覽:
剛才測了一下你寫的code. 問題是不大. 不過可以改幾個地方. 1、headers["Accept-Encoding"]="None";. gzip還要解,沒啥必要. 2、url 不要抓 https 的,改成 http. 這樣應該可以跑. https://postimg.org/image/n18
(還有61個字)

推噓0(0推 0噓 0→)留言0則,0人參與, 最新作者orafrank (法蘭克 )時間9年前 (2016/12/20 11:58), 編輯資訊
0
0
5
內容預覽:
抓取新聞列表搞定了. 但是單獨進入個別新聞頁面時 抓取就被拒絕了. 各種hearder都加了,還是被拒絕。. 怎麼辦呢? CODE如下. import requests. import csv. from bs4 import BeautifulSoup. import urllib2. impor
(還有2004個字)
首頁
上一頁
1
下一頁
尾頁