[請益] 關於PHP抓網頁的程式有問題

看板PHP作者 (柯呆)時間16年前 (2009/03/16 13:23), 編輯推噓1(103)
留言4則, 1人參與, 最新討論串1/1
<?php //$fp=fopen('http://tw.search.yahoo.com/search?p=121&fr=yfp&ei=utf-8&v=0','r'); $fp=fopen('http://www.yahoo.com.tw','r'); while ($line=fgets($fp,1024)){ //echo $line; //if(preg_match_all('/<.*?a.*?href=\s*?[\'"](*+)[\'"].*?\s>(*+)<\/.*?a.*>/i',$line,$matches)) preg_match_all("/<.*?a.*?href=.*?[\'\"](.*?)[\'\"].?>(.*?)<\/.*?a.*?>/i",$line,$matches); }//while for($i=0;$i<count($matches[0 ]);$i++){ echo "name:".$matches[2 ][$i]."\n"; echo "url:".$matches[1 ][$i]."\n";} } fclose($p); ?> 這是我們寫的抓網頁的程式 可是一直都跑不出東西 有人可以幫我們看看嗎 -- ※ 發信站: 批踢踢實業坊(ptt.cc) ◆ From: 140.130.189.14

03/16 14:19, , 1F
你的while....
03/16 14:19, 1F

03/16 14:20, , 2F
把preg_match_all拿到迴圈外面 用file_get_contents
03/16 14:20, 2F

03/16 14:20, , 3F
取代while_fgets讀整個內容
03/16 14:20, 3F

03/16 14:21, , 4F
不然match總是會被最後一串的東西蓋掉
03/16 14:21, 4F
文章代碼(AID): #19lU96qr (PHP)
文章代碼(AID): #19lU96qr (PHP)