[請益] 抓取網頁html原始碼
急迫需要寫隻php來抓取某網頁的html
以便作parse切出所需要的
參考精華區 再到處亂找 結果改成四不像...
<html>
<head>
<meta http-equiv="Content-Type" content="text/html; charset=big5" />
<title>Network Programming Homework 3</title>
</head>
<body bgcolor=#CCC999 text="#FFFFFF">
<div align=center>
<font size="3">
<form method="get">
<tr><td><center>URL: <input name="URL" SIZE="40"></td></tr>
<tr><td><center><input type="submit" value="START"> <input type="reset"
value="RESET"></center></td></tr>
<?php
$url = $_GET['URL'].$_POST['words'];
$ch = curl_init(); //初始化curl,要準備開始抓網頁
curl_setopt($ch, CURLOPT_URL, $url); //告訴url要抓的是第一行的網頁
curl_setopt($ch, CURLOPT_RETURNTRANSFER, 1); //不要將抓回來的網頁秀到螢幕上,
//等等我們要繼續分析
$content = curl_exec($ch); //抓吧,然後將資料存到$content
curl_close($ch);
$html = htmlentities($content);
$tok = strtok($html, "<h3>posting history</h3>");
echo $tok;
?>
</form>
</font>
</div>
</body>
</html>
PHP網頁 : http://140.113.167.207/~nck/DM.php
輸入網頁 : http://del.icio.us/url/bc2930ff48e6bb275511c3ea0b451c37?all
需要切出 右下角 posting history那一大塊的tag資料
可是輸出切出後的$tok內容卻是 &l
想請問該怎樣改才能達到功能呢??
第一次寫php請多指教 謝謝!!
--
※ 發信站: 批踢踢實業坊(ptt.cc)
◆ From: 140.113.167.221
推
05/16 14:10, , 1F
05/16 14:10, 1F
推
05/16 16:02, , 2F
05/16 16:02, 2F
→
05/16 16:04, , 3F
05/16 16:04, 3F
※ 編輯: NCK 來自: 140.113.167.221 (05/16 16:16)
討論串 (同標題文章)
PHP 近期熱門文章
PTT數位生活區 即時熱門文章