PTT
數位生活區
即時熱門文章
24小時內熱門文章
最新文章
熱門看板
看板列表
我的收藏
最近瀏覽
批踢踢 PTT 搜尋引擎
看板
[
PHP
]
討論串
[請益] 抓取網頁html原始碼
共 4 篇文章
排序:
最新先
|
最舊先
|
留言數
|
推文總分
內容預覽:
開啟
|
關閉
|
只限未讀
首頁
上一頁
1
下一頁
尾頁
#4
Re: [請益] 抓取網頁html原始碼
推噓
0
(0推
0噓 0→
)
留言
0則,0人
參與
,
最新
作者
kornelius
(Kornelius)
時間
18年前
發表
(2007/05/17 22:29)
,
編輯
資訊
0篇文章回應此文
0
內文有0個圖片
image
0
內文有0個連結
link
0
內容預覽:
如果沒有要作 POST. 用 file_get_contents 就可以了。. $content = file_get_contents( "path" );. path 可以是 url 或任何路徑。. --.
※
發信站:
批踢踢實業坊(ptt.cc)
. ◆ From: 61.223.99.44.
#3
Re: [請益] 抓取網頁html原始碼
推噓
0
(0推
0噓 0→
)
留言
0則,0人
參與
,
最新
作者
foxzgerald
(O⊥M)
時間
18年前
發表
(2007/05/16 17:19)
,
編輯
資訊
0篇文章回應此文
0
內文有0個圖片
image
0
內文有0個連結
link
0
內容預覽:
^^^^^^^^^^^^^^^^^^^^^^^^^. 其實 $content 的內容就是原始的 html 字串,. 所以應該針對 $content 做 parse 才對. ^^^^^^^^^^^^^^^^^^^^^^. 這麼做則是去除 html 的"特性"--把"標籤"轉為一般的字串。. 如果你要做
#2
Re: [請益] 抓取網頁html原始碼
推噓
0
(0推
0噓 0→
)
留言
0則,0人
參與
,
最新
作者
foxzgerald
(O⊥M)
時間
18年前
發表
(2007/05/16 16:17)
,
編輯
資訊
0篇文章回應此文
0
內文有0個圖片
image
0
內文有0個連結
link
0
內容預覽:
如果要 parse的話,應該是直接解析 HTML原始碼吧,不需要 htmlentities()... htmlentities() 之後,原本的. <div>test</div>. 會變成. <div>test</div>. 這在解析的時候應該會麻煩不少... --.
※
發
#1
[請益] 抓取網頁html原始碼
推噓
2
(2推
0噓 1→
)
留言
3則,0人
參與
,
最新
作者
NCK
(守備範圍:18~25歲)
時間
18年前
發表
(2007/05/16 11:29)
,
編輯
資訊
0篇文章回應此文
0
內文有0個圖片
image
0
內文有2個連結
link
2
內容預覽:
急迫需要寫隻php來抓取某網頁的html. 以便作parse切出所需要的. 參考精華區 再到處亂找 結果改成四不像.... <html>. <head>. <meta http-equiv="Content-Type" content="text/html; charset=big5" />. <t
(還有941個字)
首頁
上一頁
1
下一頁
尾頁