PTT數位生活區 / Ajax

[請益] 如何抓取網頁"純"原始碼？

看板Ajax作者grassboy2 (活力花俏草兒仔政﹞O花俏)時間15年前 (2010/11/30 02:07)推噓0(0推 0噓 7→)

留言7則, 3人參與討論串1/1

※ [本文轉錄自 Web_Design 看板 #1Cy-kcgX ] 作者: grassboy2 (活力花俏草兒仔政﹞O花俏) 看板: Web_Design 標題: [請益] 如何抓取網頁"純"原始碼？時間: Tue Nov 30 02:06:27 2010 如標題… 以下是測試的url http://grassboy.tw/webDev/test.php 他的原始碼很簡單，只有一行 <img src=test.png /><b>哈囉！沒錯！很醜的code~ 圖片src沒有雙括號，粗體沒結尾~ 但進去網頁後… 我在網址列下了 javascript:alert(document.body.innerHTML) 結果…我測了firefox chrome ie8三種瀏覽器… 大多都是回我 <img src="test.png"><b>哈囉！ </b> 也就是說…瀏覽器會自動將這種不正確的網頁結構進行修改，並反映到innerHTML上… 那麼…有沒有辦法透過javascript取得 <img src=test.png><b>哈囉！呢？當然…這要求還滿奇怪的… 不過如果今天某個網站(ex: plurk)透過header("text/html")的介面回傳一個json物件到browser時… 我要抓json物件的值…似乎應該要抓未經瀏覽器處理過的html降子… 原本的 {"msg_html":"hihi <img src=\"xx.jpg\" />"} 會被處理成 {"msg_html":"hihi <img src="\"xx.jpg\"">"} 有點讓人傷腦筯的說 >"< -- ※ 發信站: 批踢踢實業坊(ptt.cc) ◆ From: 140.113.87.174 -- ※ 發信站: 批踢踢實業坊(ptt.cc) ◆ From: 140.113.87.174

→

11/30 11:31, , 1^F

11/30 11:31, 1^F

→

11/30 11:32, , 2^F

11/30 11:32, 2^F

→

11/30 14:59, , 3^F

11/30 14:59, 3^F

→

11/30 15:00, , 4^F

11/30 15:00, 4^F

→

11/30 15:00, , 5^F

11/30 15:00, 5^F

→

11/30 15:01, , 6^F

11/30 15:01, 6^F

→

12/06 21:27, , 7^F

12/06 21:27, 7^F

‣ 返回看板[ Ajax ] 程設

‣ 更多 grassboy2 的文章

文章代碼(AID): #1Cy-lZuZ (Ajax)

Ajax 近期熱門文章

1

2

[問題] 如何將網頁上升兩行文字用標籤機列印出來

1年前, 07/06

1

1

[工具] VSCode extension - Doc Tab

2年前, 10/10

3

6

[問題] call api promise改成同步執行

2年前, 09/28

1

1

[問題] web ptt search bar

2年前, 08/22

2

4

[問題] 前端特殊字元的比對

2年前, 08/21

2

4

[問題] 變數中有"

3年前, 04/26

1

1

[問題] 要怎樣讓windows不要把.ts檔當成多媒體

3年前, 03/22

1

1

[心得] 從繁到簡:使用Zodios重塑您的API串接體驗

3年前, 03/20

更多近期熱門文章 >>

PTT數位生活區即時熱門文章

5

18

[問題] 京東買手機請教

1小時前, 07/03

3

55

Re: [新聞] Apple Pay交通卡上路！北捷7/1全面開放

3小時前, 07/03

15

23

[情報] ！ROG 20週年限定特展，最強信仰全配

[ PC_Shopping ]

4小時前, 07/03

1

6

[硬體] apple bts方案今年還會繼續嗎？

4小時前, 07/03

77

154

[情報] Intel重新生產10, 11, 12, 14代 CPU

[ PC_Shopping ]

5小時前, 07/03

11

88

[菜單] AM4平台電腦升級請益

[ PC_Shopping ]

6小時前, 07/03

11

47

Re: [菜單] 235K 遊戲/AI生圖/本地LLM機

[ PC_Shopping ]

8小時前, 07/03

12

17

[閒聊] Adobe 宣佈收購 Topaz Labs

8小時前, 07/03

更多即時熱門文章 >>

‣ 返回看板[ Ajax ] 程設

‣ 更多 grassboy2 的文章

文章代碼(AID): #1Cy-lZuZ (Ajax)