[問題] 抓取網頁文字問題

看板C_and_CPP (C/C++)作者 (藍影)時間15年前 (2010/09/27 23:01), 編輯推噓3(3026)
留言29則, 5人參與, 最新討論串1/1
補充說明: 我已使用 VC 進行網頁文字之擷取 (應該說是 download 該網頁內容到 buffer) 好笑的是,若網頁為論壇時, 網頁之內容竟無法看到裡面人的發文與回覆 請問是否是該論壇在網頁原始碼中設有保護機制? ( 就是沒辦法取得裡面發言的內容) 問題似乎有點偏 還煩請各位有經驗的先進予以指教 -- 我期待 我等待 肩狹骨上的翅膀早些長出來 -- ※ 發信站: 批踢踢實業坊(ptt.cc) ◆ From: 180.177.76.142

09/27 23:11, , 1F
只有給網址去抓網頁?
09/27 23:11, 1F

09/27 23:42, , 2F
是的,直接給網址抓網頁 (看來似乎還是有點小問題 = =)
09/27 23:42, 2F

09/27 23:49, , 3F
因為論壇或是購物網站的資料都是由Server Pages更改後
09/27 23:49, 3F

09/27 23:50, , 4F
才讓你的瀏覽器呈現的, 本來的網頁本來就只是空空的
09/27 23:50, 4F

09/27 23:51, , 5F
框架, 除非網站需要的資訊都是用GET去取(所以你可以在
09/27 23:51, 5F

09/27 23:51, , 6F
網址上面給參數), 不然一般都是用POST來傳, 這也是為
09/27 23:51, 6F

09/27 23:52, , 7F
什麼有些資料會因登入者身分而不同的原因
09/27 23:52, 7F

09/27 23:57, , 8F
看有沒有什麼API可以直接呼叫, 不然可能需要去模擬
09/27 23:57, 8F

09/27 23:58, , 9F
POST Request了
09/27 23:58, 9F

09/28 00:56, , 10F
嗯,謝謝您的細心回答,我想對於這方面的知識我仍有待
09/28 00:56, 10F

09/28 00:56, , 11F
加強,再次感覺您的細心回覆!!
09/28 00:56, 11F

09/28 00:59, , 12F
!! 意思是說,我可能要再send ID, PSW過去,得到的資訊
09/28 00:59, 12F

09/28 01:00, , 13F
可能會不同吧?所以接下來我要做的是:怎麼send帳密
09/28 01:00, 13F

09/28 01:00, , 14F
過去是吧?
09/28 01:00, 14F

09/28 01:00, , 15F
(Send 帳密方式會不會每個網站都有些不同 = =)
09/28 01:00, 15F

09/28 01:00, , 16F
是的
09/28 01:00, 16F

09/28 01:01, , 17F
你要先觀察他們form裡傳送了哪些資料, 最好還是抓封包
09/28 01:01, 17F

09/28 01:02, , 18F
所以.. 我還要先"解析"(破解)那網站怎麼讀帳密?
09/28 01:02, 18F

09/28 01:02, , 19F
來瞧仔細
09/28 01:02, 19F

09/28 01:02, , 20F
嗯嗯, 謝謝您的回答,看來這下有很多topic可以進修了XD
09/28 01:02, 20F

09/28 01:31, , 22F
裡面的frmget似乎可以取得輸入表單後的網址
09/28 01:31, 22F

09/28 02:01, , 23F
雖然這邊是C語言版... 我會建議你去學PHP+cURL
09/28 02:01, 23F

09/28 02:31, , 24F
嗯, 謝謝樓上建議. 還蠻怕PHP會有點進入障礙的說 XD
09/28 02:31, 24F

09/28 02:31, , 25F
印象中環境似乎不是很好架設..
09/28 02:31, 25F

09/28 02:32, , 26F
謝謝 purpose 給的好東西!!
09/28 02:32, 26F

09/28 02:32, , 27F
python 也不錯 , PHP 在win 下要架就裝個appserv就有了
09/28 02:32, 27F

09/28 02:36, , 28F
不知道有沒有誤解frmget的意思..‧Your password will
09/28 02:36, 28F

09/28 02:37, , 29F
be visible to..這種方式會有其它安全性問題嗎?
09/28 02:37, 29F
文章代碼(AID): #1CeB7GGV (C_and_CPP)
文章代碼(AID): #1CeB7GGV (C_and_CPP)