Re: [問題] preg_match_all抓取所有<div>....</div>
看板RegExp (正規表示式 Regular Expression)作者kornelius (c9s)時間15年前 (2009/07/25 21:25)推噓3(3推 0噓 1→)留言4則, 4人參與討論串4/4 (看更多)
請用 Perl 的 Web::Scraper 模組 :p
http://search.cpan.org/dist/Web-Scraper/lib/Web/Scraper.pm
就可以做到 tree structure 的 parsing
只需要給定 css selector 即可
當然也有 xpath 做 selector 的後端。
※ 引述《X700 (X700)》之銘言:
: ※ 引述《grassboy2 (活力花俏草兒仔政﹞O花俏)》之銘言:
: 我也有問題和這位仁兄相似,但是我想做的就是巢狀時要如何正確抓資料呢?
: 如下的例子:
: <div class="test">
: <div>我是大巢
: <div>我是小巢</div>
: </div>
: </div>
: 希望可以抓到div class="test"內的資料:
: <div>我是大巢
: <div>我是小巢</div>
: </div>
--
--
※ 發信站: 批踢踢實業坊(ptt.cc)
◆ From: 113.61.194.203
※ 編輯: kornelius 來自: 113.61.194.203 (07/25 21:26)
推
07/27 16:07, , 1F
07/27 16:07, 1F
推
07/28 00:47, , 2F
07/28 00:47, 2F
推
07/30 19:52, , 3F
07/30 19:52, 3F
→
08/11 17:59, , 4F
08/11 17:59, 4F
討論串 (同標題文章)
本文引述了以下文章的的內容:
完整討論串 (本文為第 4 之 4 篇):
RegExp 近期熱門文章
PTT數位生活區 即時熱門文章