[請益] 抓網頁原始碼

看板Web_Design作者 (阿政)時間18年前 (2008/08/20 21:27), 編輯推噓1(103)
留言4則, 3人參與, 最新討論串1/1
請問大家一個問題 我現在寫一個網頁要去抓取其他網頁的原始碼... 但是 因為測試了太大量了 對方網頁的伺服器好像封鎖我這邊的IP 使得我都抓不到 在網路上有查到說要更改參照頁 不知道這樣是不是真的有用 還有要怎樣更改參照頁..... -- ※ 發信站: 批踢踢實業坊(ptt.cc) ◆ From: 61.227.128.231

08/20 21:41, , 1F
如果是鎖IP的話,改Referer就沒用
08/20 21:41, 1F

08/20 21:44, , 2F
請問一下有其他辦法可以抓到嗎?
08/20 21:44, 2F

08/20 22:10, , 3F
如果是開socket , 那是在header資訊中的 reference page
08/20 22:10, 3F

08/20 22:11, , 4F
你可以用proxy , 透過第三方去抓就比較有機會.
08/20 22:11, 4F
文章代碼(AID): #18h1kmxy (Web_Design)
文章代碼(AID): #18h1kmxy (Web_Design)