討論串(共4篇) - [請益] 抓取網頁html原始碼 - 看板PHP

看板 [ PHP ]

討論串[請益] 抓取網頁html原始碼

共 4 篇文章

排序：最新先 | 最舊先 | 留言數 | 推文總分

內容預覽：開啟 | 關閉 | 只限未讀

首頁

尾頁

Re: [請益] 抓取網頁html原始碼

推噓0(0推 )留言0則，0人參與作者kornelius (Kornelius)時間19年前 (2007/05/17 22:29)資訊

內容預覽:

如果沒有要作 POST. 用 file_get_contents 就可以了。. $content = file_get_contents( "path" );. path 可以是 url 或任何路徑。. --. ※ 發信站: 批踢踢實業坊(ptt.cc). ◆ From: 61.223.99.44.

Re: [請益] 抓取網頁html原始碼

推噓0(0推 )留言0則，0人參與作者foxzgerald (O⊥M)時間19年前 (2007/05/16 17:19)資訊

內容預覽:

^^^^^^^^^^^^^^^^^^^^^^^^^. 其實 $content 的內容就是原始的 html 字串，. 所以應該針對 $content 做 parse 才對. ^^^^^^^^^^^^^^^^^^^^^^. 這麼做則是去除 html 的"特性"－－把"標籤"轉為一般的字串。. 如果你要做

Re: [請益] 抓取網頁html原始碼

推噓0(0推 )留言0則，0人參與作者foxzgerald (O⊥M)時間19年前 (2007/05/16 16:17)資訊

內容預覽:

如果要 parse的話，應該是直接解析 HTML原始碼吧，不需要 htmlentities()... htmlentities() 之後，原本的. <div>test</div>. 會變成. <div>test</div>. 這在解析的時候應該會麻煩不少... --. ※ 發

[請益] 抓取網頁html原始碼

推噓2(2推 )留言3則，0人參與作者NCK (守備範圍:18~25歲)時間19年前 (2007/05/16 11:29)資訊

內容預覽:

急迫需要寫隻php來抓取某網頁的html. 以便作parse切出所需要的. 參考精華區再到處亂找結果改成四不像.... <html>. <head>. <meta http-equiv="Content-Type" content="text/html; charset=big5" />. <t

(還有941個字)

首頁

尾頁