看板 [ PHP ]
討論串[請益] 抓取網頁html原始碼
共 4 篇文章
首頁
上一頁
1
下一頁
尾頁

推噓0(0推 0噓 0→)留言0則,0人參與, 最新作者kornelius (Kornelius)時間18年前 (2007/05/17 22:29), 編輯資訊
0
0
0
內容預覽:
如果沒有要作 POST. 用 file_get_contents 就可以了。. $content = file_get_contents( "path" );. path 可以是 url 或任何路徑。. --. 發信站: 批踢踢實業坊(ptt.cc). ◆ From: 61.223.99.44.

推噓0(0推 0噓 0→)留言0則,0人參與, 最新作者foxzgerald (O⊥M)時間18年前 (2007/05/16 17:19), 編輯資訊
0
0
0
內容預覽:
^^^^^^^^^^^^^^^^^^^^^^^^^. 其實 $content 的內容就是原始的 html 字串,. 所以應該針對 $content 做 parse 才對. ^^^^^^^^^^^^^^^^^^^^^^. 這麼做則是去除 html 的"特性"--把"標籤"轉為一般的字串。. 如果你要做

推噓0(0推 0噓 0→)留言0則,0人參與, 最新作者foxzgerald (O⊥M)時間18年前 (2007/05/16 16:17), 編輯資訊
0
0
0
內容預覽:
如果要 parse的話,應該是直接解析 HTML原始碼吧,不需要 htmlentities()... htmlentities() 之後,原本的. <div>test</div>. 會變成. &lt;div&gt;test&lt;/div&gt;. 這在解析的時候應該會麻煩不少... --.

推噓2(2推 0噓 1→)留言3則,0人參與, 最新作者NCK (守備範圍:18~25歲)時間18年前 (2007/05/16 11:29), 編輯資訊
0
0
2
內容預覽:
急迫需要寫隻php來抓取某網頁的html. 以便作parse切出所需要的. 參考精華區 再到處亂找 結果改成四不像.... <html>. <head>. <meta http-equiv="Content-Type" content="text/html; charset=big5" />. <t
(還有941個字)
首頁
上一頁
1
下一頁
尾頁