Re: [請益] 1437篇中curl抓取原始檔部分

看板PHP作者 (不要食言 會肥)時間17年前 (2008/10/03 20:16), 編輯推噓1(100)
留言1則, 1人參與, 最新討論串2/2 (看更多)
※ 引述《Flychop (醉心)》之銘言: : 實作起來是成功可行的!也感謝bigair教我怎麼寫正規化 : 現在遇上的問題是網址改成這個 : http://www.exalead.com/search/results?q= : 卻會出現什麼『This page was move here』,而here可以超連結到我要抓的網頁 : 另外網址改成 : http://search.live.com/results.aspx?q= : 抓到的網頁卻是中文版的live search,但在瀏覽器中輸入網址是英文的呀! 1. 因為 www.exalead.com 會轉向,所以你要加一行 curl_setopt($ch, CURLOPT_FOLLOWLOCATION,1); 正規表示式 /<div class="c337">.*?about\s+<b>([\d,]+)<\/b>/ 2. search.live.com 會判斷使用者地區在哪,要固定找英文網頁,加個cookies進去吧 $_COOKIES['mkt2']['ui'] = en-US curl_setopt 有幾個相關 cookies 的用法,請參照官網。 正規表示式懶得寫了。 0rz -- 今天發生了件小小的好事情唷 我擺在鞋櫃的鞋子裡面被放了圖釘 明明班上有50人之多 偏偏就挑上了我 這正是有某個人 比任何人都要在意我的證據 為了想將這小小的喜悅 也跟大家分享 我在每個人的鞋子裡 都各分放了一粒圖釘 -- ※ 發信站: 批踢踢實業坊(ptt.cc) ◆ From: 123.195.0.145

10/03 20:19, , 1F
謝謝...really
10/03 20:19, 1F
文章代碼(AID): #18vWqAXk (PHP)
文章代碼(AID): #18vWqAXk (PHP)