Re: [問題] 關於抓取網頁資料

看板Python作者 (告白當然要唱這首歌)時間16年前 (2009/06/28 19:41), 編輯推噓2(202)
留言4則, 3人參與, 最新討論串2/2 (看更多)
※ 引述《lauer (Enjoy it)》之銘言: : 不好意思第一次想嘗試抓網頁資料 : 一般的網頁知道怎麼去抓取,我是用最簡單的 urllib.urlopen('..') : 然後再找出我要的關鍵字 : 但是有的網頁如果直接連的話 : 就會出現 "You do not have a session." 的訊息 : 請問這該如何解決呢? : 麻煩大家了,謝謝! 可能用wireshark或是firefox去觀察一下http的headers 通常是加個Referer就會過了 -- ※ 發信站: 批踢踢實業坊(ptt.cc) ◆ From: 61.217.30.161

06/28 20:00, , 1F
謝謝解說~不過 不是很懂@@ Referer? 方便再多點資訊嗎~
06/28 20:00, 1F

06/28 23:07, , 2F
所謂的Referer就是從一個url連過來的資訊。
06/28 23:07, 2F

06/28 23:08, , 3F
若你從 A連到B。 則你把會A url referer資訊帶著到B ..
06/28 23:08, 3F

07/02 20:11, , 4F
文章代碼(AID): #1AHrRHsN (Python)
討論串 (同標題文章)
文章代碼(AID): #1AHrRHsN (Python)