Re: [請益] Google擋robot?
自問自答:
答案跟網友猜測的一樣,是timeout的問題,
在一開始加set_time_limit還不夠。
只寫CURLOPT_CONNECTTIMEOUT是不夠的,
還要加CURTOPT_TIMEOUT
這二者有小小的差異。
※ 引述《mewtwo (mewtwo)》之銘言:
: 以下是我寫的一個小程式,主要是重覆地向google要求某些資訊。
: 但是後來發現,迴圈(i)總是無法超過最多10,
: (停止的地方每次都不一樣)
: 先否請問先進們,我到底是那邊做錯了嗎?
: (這程式真的非常簡單,但是問題一直解決不了,快抓狂了)
: 在此先謝謝了。
: for( $i = 0; $i < $numLine; $i++ ){
: for( $j = 0; $j < $numLine; $j++ ){
: // $str1 and $str2是一連串的關鍵字,一直在變化。
: $url = "http://www.google.com/search?hl=en&q=".$str1."+".$str2;
: $ch = curl_init();
: $timeout = 60;
: curl_setopt($ch, CURLOPT_URL, $url);
: curl_setopt($ch, CURLOPT_RETURNTRANSFER, 1);
: curl_setopt($ch, CURLOPT_CONNECTTIMEOUT, $timeout );
: curl_setopt($ch, CURLOPT_USERAGENT, "Yahoo Bot" );
: //sleep(1);
: $contents = curl_exec($ch);
: curl_close($ch);
: // 在此對 $contents做處理
: } // end for $j
: fputs( $output, "\n" );
: echo "<br/>";
: } // end for $i
--
※ 發信站: 批踢踢實業坊(ptt.cc)
◆ From: 128.211.252.99
討論串 (同標題文章)
本文引述了以下文章的的內容:
完整討論串 (本文為第 2 之 2 篇):
PHP 近期熱門文章
PTT數位生活區 即時熱門文章