看板 [ PHP ]
討論串[請益] 遠端網頁抓取字串的問題
共 15 篇文章

推噓0(0推 0噓 0→)留言0則,0人參與, 最新作者foxzgerald (O⊥M)時間18年前 (2007/05/18 16:12), 編輯資訊
0
0
0
內容預覽:
這得看該 server 的判斷機制,如果如你所說的會判斷 IP. 那麼就得透過 proxy來取得內容。. header 的情況則是,如果 web application 會依照瀏覽器. 的不同,而導向不同的網頁、或者是一定要支援 cookie 才. 給瀏覽之類的情況...凡是跟 http 所提供的機
(還有46個字)

推噓0(0推 0噓 0→)留言0則,0人參與, 最新作者fillmore (.......................)時間18年前 (2007/05/18 16:02), 編輯資訊
0
0
0
內容預覽:
我不懂為什麼會沒有關係呢?. 今天我的電腦和你的電腦都用相同的瀏覽器IE去看一個網址的網頁. 看到的結果會不一樣 , 因為很有可能因為ip的不同(地區不同) , 對方server會把你. 導向不同server的網頁 (就我所知很多server都是這樣的作法). 你就算丟同樣的header也沒有用.

推噓3(3推 0噓 1→)留言4則,0人參與, 最新作者foxzgerald (O⊥M)時間18年前 (2007/05/18 14:29), 編輯資訊
0
0
3
內容預覽:
server/client 在 internet 上,廣義而言,其實是種相對的概念。. 若能完全模擬 client/browser 的行為,理論上兩者應可看到相同的. 結果。. 因此,如果想寫 robot,讓它能夠自動抓取、解析網頁,那麼最好先. 了解 browser 的運作方式--特別是遇到一些
(還有505個字)

推噓0(0推 0噓 0→)留言0則,0人參與, 最新作者kornelius (Kornelius)時間18年前 (2007/05/18 14:07), 編輯資訊
0
0
0
內容預覽:
我想你說的應該是 client 端的 ip ...... 但是跟 client 的 ip 沒有關係。. 有關係的是你的 client 送什麼樣的 header 過去。. --. 發信站: 批踢踢實業坊(ptt.cc). ◆ From: 61.223.99.44. 編輯: kornelius

推噓1(1推 0噓 0→)留言1則,0人參與, 最新作者fillmore (.......................)時間18年前 (2007/05/18 14:04), 編輯資訊
0
0
4
內容預覽:
說的都沒錯,我沒有說這些方法不能夠抓可是抓到的東西不是我想要的. 因為web server的ip不同他去瀏覽網頁的結果,和我直接去用瀏覽器看到的結果並不一樣. 抓到的東西自然不是我想要的@@. 跑你的php程式的不是web server那應該叫什麼@@?. --. 發信站: 批踢踢實業坊(ptt