[問題] 萊爾富門市爬蟲 踢到鐵板
各位大大好,遇到一個鐵板,
可能跟程式語言比較沒關係,
專案需要定期抓萊爾富的全部所有門市,
找到其官網門市查詢所在位置,
https://www.hilife.com.tw/storeInquiry_street.aspx
大約看一下網頁原碼,
應該是ASP.Net & WebForm無誤,
GET跟POST都是這一支,
所以邏輯思路如下:
方法1:
先用GET不帶參數發出Request,
取得回傳網頁後,剖析取出
__VIEWSTATEGENERATOR
__EVENTVALIDATION
__VIEWSTATE
__EVENTTARGET
__EVENTARGUMENT
__LASTFOCUS
等等數值,
然後塞入POST內,
再填入自訂的縣市CITY與鄉區AREA後,
發出Request,
台北市全區沒問題,
都可以取得門市資料,
但詭異的是:
其他縣市與鄉區卻直接拒絕連結.....!!??
試用方法2
先用GET取得__VIEWSTATE值之後,
再發出台北市中山區的POST,
得到正常回傳結果後再取一次全部__VIEWSTATE值,
然後再塞入,填上新北市林口區再發出POST,
.....一樣失敗,拒絕連結!
試用方法3
把GET取得__VIEWSTATE值,
手工寫入靜態HTML網頁內的FORM input內,
指定雲林縣虎尾鎮
然後按submit post出去,
.........成功正常回傳
感覺有點崩潰,沒頭緒....
猜想因為台北市是default頁,
所以沒有設檢查,
不瞭解ASP.Net的後端作法,
有大大可以提供解法建議嗎?
感恩~
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 119.14.24.108 (臺灣)
※ 文章網址: https://www.ptt.cc/bbs/Python/M.1589018306.A.D26.html
※ 編輯: somehog (119.14.24.108 臺灣), 05/09/2020 18:03:36
→
05/09 18:19,
5年前
, 1F
05/09 18:19, 1F
如果是方法1的話,差別就只是填入台北市跟其他縣市不同,其他參數完全相同
推
05/09 18:21,
5年前
, 2F
05/09 18:21, 2F
→
05/09 18:21,
5年前
, 3F
05/09 18:21, 3F
→
05/09 18:24,
5年前
, 4F
05/09 18:24, 4F
→
05/09 18:24,
5年前
, 5F
05/09 18:24, 5F
也有懷疑cookie的嫌疑...只好用selenium 硬破了 還真想知道兇手是誰呀
推
05/09 20:16,
5年前
, 6F
05/09 20:16, 6F
→
05/09 21:40,
5年前
, 7F
05/09 21:40, 7F
※ 編輯: somehog (119.14.24.108 臺灣), 05/09/2020 22:53:34
※ 編輯: somehog (119.14.24.108 臺灣), 05/09/2020 22:57:13
推
05/09 23:34,
5年前
, 8F
05/09 23:34, 8F
→
05/09 23:35,
5年前
, 9F
05/09 23:35, 9F
→
05/09 23:36,
5年前
, 10F
05/09 23:36, 10F
→
05/09 23:37,
5年前
, 11F
05/09 23:37, 11F
→
05/09 23:38,
5年前
, 12F
05/09 23:38, 12F
__EVENTTARGET確認填入CITY無誤,
方法2就是取第一次POST台北市後得到的FORM內所有
欄值再套入一個新的POST基隆市...然後就GG了
※ 編輯: somehog (119.14.24.108 臺灣), 05/09/2020 23:41:09
→
05/09 23:44,
5年前
, 13F
05/09 23:44, 13F
→
05/09 23:51,
5年前
, 14F
05/09 23:51, 14F
推
05/10 00:08,
5年前
, 15F
05/10 00:08, 15F
→
05/10 00:08,
5年前
, 16F
05/10 00:08, 16F
推
05/10 10:41,
5年前
, 17F
05/10 10:41, 17F
→
05/10 10:41,
5年前
, 18F
05/10 10:41, 18F
→
05/10 10:42,
5年前
, 19F
05/10 10:42, 19F
→
05/10 10:43,
5年前
, 20F
05/10 10:43, 20F
推
05/10 10:48,
5年前
, 21F
05/10 10:48, 21F
→
05/10 10:48,
5年前
, 22F
05/10 10:48, 22F
→
05/10 12:22,
5年前
, 23F
05/10 12:22, 23F
→
05/10 12:22,
5年前
, 24F
05/10 12:22, 24F
討論串 (同標題文章)
Python 近期熱門文章
PTT數位生活區 即時熱門文章