Re: [問題] 抓取的內容不符 新手發問
看板RegExp (正規表示式 Regular Expression)作者knuckles (那克斯)時間13年前 (2011/11/21 14:18)推噓1(1推 0噓 0→)留言1則, 1人參與討論串2/2 (看更多)
※ 引述《o500521 (poet)》之銘言:
: 使用php 內建的模擬perl
: 我的目標要抓 取一個網站的html
: ------------------以下是html------------------
: 不知道大大們會怎麼處理這問題謝謝各位願意閱覽的人
: 一直不太懂正規表示法的精隨
: 謝謝~大家
先學一下怎麼問問題吧
你的問題可以精簡成這樣:
------------------以下是html------------------
...</div><h1>字串1</h1><div>...</div><div class="aff">
<h3 class="label">Source</h3><p>字串2</p></div>
<div class="abstr"><h3>Abstract</h3><p>字串3</p></div>
----------------------------------------------
使用 preg_match_all("|<[/h3><p]>(.*)</[p></div>]+>|U", $P_string, $P_dd);
抓到
字串2 字串3
但想要的是
字串1 字串3
至於該怎麼做才對,因為你的問題太偷懶,害我看了半天才看懂你問什麼
所以我不想回答,看有沒有其他人想回吧
--
※ 發信站: 批踢踢實業坊(ptt.cc)
◆ From: 111.248.5.208
推
11/21 17:56, , 1F
11/21 17:56, 1F
討論串 (同標題文章)
本文引述了以下文章的的內容:
完整討論串 (本文為第 2 之 2 篇):
RegExp 近期熱門文章
PTT數位生活區 即時熱門文章