PTT數位生活區 / PHP

[請益] curl抓網頁的問題

看板PHP作者thelibertine (玩樂者)時間12年前 (2014/01/08 02:07)推噓2(2推 0噓 3→)

留言5則, 4人參與討論串1/1

請教版上的各位大大最近我用curl在抓http://www.books.com.tw/ 這個網站的資料我主要是想抓商品的資料所以我用http://www.books.com.tw/products/0010618102 類似這樣的網址,只去改變後面那段數字用迴圈去跑當然如果跑到沒有這筆資料的編號就會跳過有這筆資料就會擷取下來一切都非常的順利但是當跑連續一小段時間,大概300~400筆資料後網站的回應時間就會變得非常的長,不知道是什麼緣故呢？是不是此網站有防止同一個ip在短時間連續的造訪？我的curl參數如下 $options = array(CURLOPT_URL => 'http://www.books.com.tw/products/'.$booksId, CURLOPT_HEADER => false, CURLOPT_RETURNTRANSFER => true, CURLOPT_USERAGENT => "Google Bot", CURLOPT_CONNECTTIMEOUT=>1, CURLOPT_FOLLOWLOCATION => true ); curl_setopt_array($ch, $options); $dataString = curl_exec($ch); 不知道有什麼辦法可以讓抓取資料的時間不要突然變長？可能的原因是什麼呢？該如何調整？還是有其他的方式可以去抓取資料還麻煩各位指教,謝謝！ -- ※ 發信站: 批踢踢實業坊(ptt.cc) ◆ From: 114.32.172.148

推

01/08 02:42, , 1^F

01/08 02:42, 1^F

推

01/08 02:45, , 2^F

01/08 02:45, 2^F

→

01/08 08:25, , 3^F

01/08 08:25, 3^F

→

01/08 15:44, , 4^F

01/08 15:44, 4^F

→

01/08 16:46, , 5^F

01/08 16:46, 5^F

‣ 返回看板[ PHP ] 程設

‣ 更多 thelibertine 的文章

文章代碼(AID): #1Ip49Gpy (PHP)

PHP 近期熱門文章

1

3

[請益] 升級php8 之後的問題已刪文

1年前, 09/26

2

5

Re: [閒聊] 從PHP7升級到PHP8後解決count()的錯誤

1年前, 07/01

2

2

[請益] 請問如何查詢目前正在跑的程序？

1年前, 05/23

1

4

Re: [請益] 日期選擇後無法顯示在新頁面

1年前, 04/12

3

10

[請益] docker取token問題

1年前, 03/16

3

4

Re: [請益] 關於徵才條件的設定

1年前, 03/14

1

1

[請益] xampp無法外部連線問題

1年前, 03/01

2

9

[請益] 一個很基本的指定運算子的問題?

1年前, 01/27

更多近期熱門文章 >>

PTT數位生活區即時熱門文章

5

24

[請益] 想買金屬接觸面較長的USB3.0公頭線材

[ PC_Shopping ]

3小時前, 11/24

5

17

[問題] 拿來打遊戲的平板選擇M4 vs gen3

9小時前, 11/24

6

16

[問題] 安卓手機輸入文字太長，不會出現下拉

9小時前, 11/24

37

115

[請益] 記憶體一年內會跌回原價嗎？

[ PC_Shopping ]

10小時前, 11/23

3

23

Re: [討論] S25U指紋辨識問題及換機心得

11小時前, 11/23

8

32

Re: [討論] 多年來小米的小米手機品牌經營不太起來

11小時前, 11/23

5

11

[問題] PD包的發票弄丟了還有辦法終身保嗎?

11小時前, 11/23

6

32

[閒聊] Air100偷改版沒公告沒改名字是什麼操作

[ PC_Shopping ]

11小時前, 11/23

更多即時熱門文章 >>

‣ 返回看板[ PHP ] 程設

‣ 更多 thelibertine 的文章

文章代碼(AID): #1Ip49Gpy (PHP)