[請益] 抓取需要登入網站的原始碼

看板PHP作者 (嚮往湛藍)時間13年前 (2012/04/11 11:36), 編輯推噓5(5010)
留言15則, 6人參與, 最新討論串1/2 (看更多)
如標題 因為我想要從一些討論區抓取原始碼 但是那些頁面有登入跟沒有登入顯示的資訊不一樣 我是使用file()的方式抓取 可是這樣就只會抓到未登入的網頁原始碼… 有什麼方法可以讓他正確的抓到登入的資訊 然後讓我抓到我要的原始碼 我要抓的網站是: http://my2.tmu.edu.tw 先謝謝各位了 -- posted from android bbs reader on my HTC Sensation Z710e https://market.android.com/details?id=com.bbs.reader -- ※ 發信站: 批踢踢實業坊(ptt.cc) ◆ From: 203.71.94.31

04/11 12:01, , 1F
呃.... 因為沒session.... 沒用php寫過這個.... 妳看看有沒
04/11 12:01, 1F

04/11 12:01, , 2F
有模擬瀏覽器的libary
04/11 12:01, 2F

04/11 12:27, , 3F
看登入有沒有session,有的話copy下來放在header中丟過去?
04/11 12:27, 3F

04/11 12:28, , 4F
抓SessionID看看@@
04/11 12:28, 4F

04/11 13:19, , 5F
curl ?
04/11 13:19, 5F

04/11 14:42, , 6F
我在到網路上爬文怎抓session出來好了
04/11 14:42, 6F

04/11 14:42, , 7F
自學真的需要努力查資料
04/11 14:42, 7F

04/11 15:43, , 8F
能抓到session資料的不是駭客嗎XD
04/11 15:43, 8F

04/11 16:13, , 9F
不用抓session資料啊,他的 cookie 好像有紀錄 session
04/11 16:13, 9F

04/11 16:13, , 10F
代表他可能是用這個 session 紀錄的,只要傳資料時設定這個
04/11 16:13, 10F

04/11 16:14, , 11F
session 就沒問題了,前提是要在這個session的存活時間中做
04/11 16:14, 11F

04/11 16:14, , 12F
存取,否則若session被清除就沒用了
04/11 16:14, 12F

04/11 16:43, , 13F
嗯嗯 我所學習的東西太基本了@@
04/11 16:43, 13F

04/11 16:46, , 14F
回家之後再用電腦實作看看
04/11 16:46, 14F

04/11 17:13, , 15F
請用 curl cookies
04/11 17:13, 15F
文章代碼(AID): #1FXFmm3E (PHP)
文章代碼(AID): #1FXFmm3E (PHP)