Re: [請益] Google擋robot?

看板PHP作者 (mewtwo)時間16年前 (2009/08/17 11:07), 編輯推噓0(000)
留言0則, 0人參與, 最新討論串2/2 (看更多)
自問自答: 答案跟網友猜測的一樣,是timeout的問題, 在一開始加set_time_limit還不夠。 只寫CURLOPT_CONNECTTIMEOUT是不夠的, 還要加CURTOPT_TIMEOUT 這二者有小小的差異。 ※ 引述《mewtwo (mewtwo)》之銘言: : 以下是我寫的一個小程式,主要是重覆地向google要求某些資訊。 : 但是後來發現,迴圈(i)總是無法超過最多10, : (停止的地方每次都不一樣) : 先否請問先進們,我到底是那邊做錯了嗎? : (這程式真的非常簡單,但是問題一直解決不了,快抓狂了) : 在此先謝謝了。 : for( $i = 0; $i < $numLine; $i++ ){ : for( $j = 0; $j < $numLine; $j++ ){ : // $str1 and $str2是一連串的關鍵字,一直在變化。 : $url = "http://www.google.com/search?hl=en&q=".$str1."+".$str2; : $ch = curl_init(); : $timeout = 60; : curl_setopt($ch, CURLOPT_URL, $url); : curl_setopt($ch, CURLOPT_RETURNTRANSFER, 1); : curl_setopt($ch, CURLOPT_CONNECTTIMEOUT, $timeout ); : curl_setopt($ch, CURLOPT_USERAGENT, "Yahoo Bot" ); : //sleep(1); : $contents = curl_exec($ch); : curl_close($ch); : // 在此對 $contents做處理 : } // end for $j : fputs( $output, "\n" ); : echo "<br/>"; : } // end for $i -- ※ 發信站: 批踢踢實業坊(ptt.cc) ◆ From: 128.211.252.99
文章代碼(AID): #1AYCbXoM (PHP)
討論串 (同標題文章)
本文引述了以下文章的的內容:
2
6
完整討論串 (本文為第 2 之 2 篇):
2
6
文章代碼(AID): #1AYCbXoM (PHP)