[問題] 機票網站爬蟲問題
大家安安~~
我最近開始學python,想要爬機票的資料
因為不是資工相關科系的學生,所以我目前都是看網路上的教學學的
我目前是用selenium爬ctrip的網站
https://www.ctrip.com.hk/flights/
按下搜尋後,在檢查的network那邊會有機票的資料被存在SearchFlights的XHR裡面
這裡會有兩個都是叫SearchFlights的XHR
有一個是一開始就有,但他只有頭幾筆資料
另一個要等一陣子,這個才有全部資料
http://i.imgur.com/VrVUUB5.jpg

我用selenium打開之後,對他requests.post
因為request的url都一樣,所以出來都只給我頭幾筆資料的那個
在他請求的參數裡面是有seaechToken不一樣
但改了之後,回給我的資料還是只有頭幾筆
所以想問各位大大,遇到這種會延遲的該怎麼爬??
有沒有辦法讓他回傳所有機票資料
因為讓他sleep也沒用...
不好意思,麻煩大家了
・゚・(。>Д<。)・゚・
・゚・(。>Д<。)・゚・
-----
Sent from JPTT on my Asus ASUS_Z016D.
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 111.71.68.128
※ 文章網址: https://www.ptt.cc/bbs/Python/M.1527326206.A.AEA.html
※ 編輯: haru97724 (111.71.68.128), 05/26/2018 17:22:29
→
05/27 10:07,
7年前
, 1F
05/27 10:07, 1F
post的參數只有searchToken不一樣,但改了結果還是一樣。
推
05/27 17:18,
7年前
, 2F
05/27 17:18, 2F
→
05/27 17:18,
7年前
, 3F
05/27 17:18, 3F
可是如果等他跑完,我再request一次,這樣不就又重新來一次了嗎?
我去研究一下不用selenium的方法XDD
※ 編輯: haru97724 (111.71.68.128), 05/27/2018 18:33:50
討論串 (同標題文章)
完整討論串 (本文為第 1 之 2 篇):
Python 近期熱門文章
PTT數位生活區 即時熱門文章