PTT數位生活區 / Python

[問題] Scrapy 蜘蛛程式無法爬超過3個網頁

看板Python作者allen511081 (藍)時間11年前 (2014/12/04 13:04)推噓1(1推 0噓 4→)

留言5則, 2人參與討論串1/2 (看更多)

小弟是python 新手，最近想要抓一個鳥會的DataBase，但這個DataBase的頁面沒有其他連結，於是自己以程式產出連結，並丟給爬蟲程式去爬，程式可以正常執行，無奈程式只要爬超過三個網頁，抓下來的資料順序就會出錯，請教各位大大，我該如何解決?? 下面附上程式碼 import scrapy import string from scrapy.http import Request from Birdtest.items import BirdItem class BirdSpider(scrapy.Spider): name = "bird" allowed_domains = ["webdata.bird.org.tw"] start_urls = ["http://webdata.bird.org.tw/contents.php?key=000001"] def parse(self, response): for sel in response.xpath('//tr/td[@colspan]'): item = BirdItem() item['desc'] = sel.xpath('text()').extract() yield item for i in xrange(2,5,1): url="http://webdata.bird.org.tw/contents.php?key=" + str(i) yield Request(url,self.parse) -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 210.70.151.159 ※ 文章網址: http://www.ptt.cc/bbs/Python/M.1417669492.A.269.html

推

12/05 15:42, , 1^F

12/05 15:42, 1^F

→

12/05 19:24, , 2^F

12/05 19:24, 2^F

→

12/05 19:25, , 3^F

12/05 19:25, 3^F

→

12/05 19:27, , 4^F

12/05 19:27, 4^F

→

12/05 19:28, , 5^F

12/05 19:28, 5^F

‣ 返回看板[ Python ] 程設

‣ 更多 allen511081 的文章

文章代碼(AID): #1KV-jq9f (Python)

討論串 (同標題文章)

以下文章回應了本文：

3

6

Re: [問題] Scrapy 蜘蛛程式無法爬超過3個網頁

11年前, 12/13

完整討論串 (本文為第 1 之 2 篇)：

排序：最新先 | 最舊先 | 留言數

3

6

Re: [問題] Scrapy 蜘蛛程式無法爬超過3個網頁

11年前, 12/13

1

5

[問題] Scrapy 蜘蛛程式無法爬超過3個網頁

11年前, 12/04

在新視窗開啟完整討論串 (共2篇)

Python 近期熱門文章

3

13

[問題] vscode的debug模式不用考慮中文路徑

2周前, 02/01

1

1

[問題] python 3.14 free thread build

3月前, 10/29

1

13

[問題] 關於正規表示法的r'\1'?

3月前, 10/22

6

9

[問題] 請問有人用過OMIA PLUS影音平台自學嗎?

4月前, 10/09

4

21

[閒聊] Python 3.13 版本是不是很爛啊！？

7月前, 07/19

15

23

[閒聊] 各位現在用os.path 還是用pathlib.Path

7月前, 07/17

6

11

[閒聊] 2024年的自我python學習

7月前, 07/17

1

2

[問題] 用Whisper AI幫我下載字幕（有酬）

10月前, 04/01

更多近期熱門文章 >>

PTT數位生活區即時熱門文章

5

8

[新聞]貴重如金恆久如鑽？土耳其新人喜獲親友贈

[ PC_Shopping ]

7小時前, 02/17

60

82

[開箱] MSI MPG X870E CARBON MAX WIFI PTT EDI置底

[ PC_Shopping ]

9小時前, 02/17

3

6

[問題] XLR線挑選

10小時前, 02/17

-2

17

[心得] 4G分享器vs手機網路速度測試

10小時前, 02/17

4

9

[問題] 台哥大廣告簡訊

11小時前, 02/17

4

7

Re: [閒聊] 除夕夜換換病發作，求退燒

13小時前, 02/17

12

27

[請益] 換耳擴後大編制很爽，但中頻後退縮水

16小時前, 02/17

6

15

[問題] 換前級後大編制很爽，但中頻後退縮水

16小時前, 02/17

更多即時熱門文章 >>

‣ 返回看板[ Python ] 程設

‣ 更多 allen511081 的文章

文章代碼(AID): #1KV-jq9f (Python)