Re: [請益] 1437篇中curl抓取原始檔部分
※ 引述《Flychop (醉心)》之銘言:
: 實作起來是成功可行的!也感謝bigair教我怎麼寫正規化
: 現在遇上的問題是網址改成這個
: http://www.exalead.com/search/results?q=
: 卻會出現什麼『This page was move here』,而here可以超連結到我要抓的網頁
: 另外網址改成
: http://search.live.com/results.aspx?q=
: 抓到的網頁卻是中文版的live search,但在瀏覽器中輸入網址是英文的呀!
1. 因為 www.exalead.com 會轉向,所以你要加一行
curl_setopt($ch, CURLOPT_FOLLOWLOCATION,1);
正規表示式
/<div class="c337">.*?about\s+<b>([\d,]+)<\/b>/
2. search.live.com 會判斷使用者地區在哪,要固定找英文網頁,加個cookies進去吧
$_COOKIES['mkt2']['ui'] = en-US
curl_setopt 有幾個相關 cookies 的用法,請參照官網。
正規表示式懶得寫了。 0rz
--
今天發生了件小小的好事情唷 我擺在鞋櫃的鞋子裡面被放了圖釘
明明班上有50人之多 偏偏就挑上了我 這正是有某個人 比任何人都要在意我的證據
為了想將這小小的喜悅 也跟大家分享
我在每個人的鞋子裡 都各分放了一粒圖釘
--
※ 發信站: 批踢踢實業坊(ptt.cc)
◆ From: 123.195.0.145
推
10/03 20:19, , 1F
10/03 20:19, 1F
討論串 (同標題文章)
本文引述了以下文章的的內容:
完整討論串 (本文為第 2 之 2 篇):
PHP 近期熱門文章
PTT數位生活區 即時熱門文章