[問題] 抓取網頁問題

看板Perl作者 (旅行)時間17年前 (2008/04/06 16:17), 編輯推噓1(102)
留言3則, 2人參與, 最新討論串1/3 (看更多)
欲抓取網頁 http://www.dmoz.org/ 抓網頁的副函式程式碼如下: sub grasp_searchresult() { my ( $query ) = @_; my $browser = new LWP::UserAgent; $browser->agent( 'Mozilla/4.76 [en] (WinXp; U)' ); my $request = q(); $request = new HTTP::Request( "Get", "http://www.dmoz.org/" ); my $html = $browser->request($request); return $html->content; } 抓出來的東西是空的 抓其它網頁例如yahoo首頁則是沒問題 不曉得是不是這個網頁有什麼特殊的限制? 謝謝! -- ※ 發信站: 批踢踢實業坊(ptt.cc) ◆ From: 140.116.245.222

04/07 03:50, , 1F
你的agent看起來很怪= =...
04/07 03:50, 1F

04/07 11:51, , 2F
一直以來都這樣寫,都OK!直到碰到這個網站才有問題
04/07 11:51, 2F

04/07 11:54, , 3F
不曉得一樓大大有什麼好的建議?
04/07 11:54, 3F
文章代碼(AID): #17-8Sr4G (Perl)
討論串 (同標題文章)
文章代碼(AID): #17-8Sr4G (Perl)