Re: [問題]請問'如何濾出網頁表格資料呢?'
※ 引述《lestersd (小事不做大事難成)》之銘言:
: 請問, 比方說這個網頁
: http://tinyurl.com/3dujed
: 我要如何才能將表格的資料濾出來使用呢?
: ( 序號, 註記, 書名, etc. )
: 不好意思, 可能是很新手的問題^^; 感謝各位;)
不... 這一點都不新手... :p
你可以用 HTML::Tree 提供的 TreeBuilder 把整份 HTML document 丟進去,
把樹建出來以後抽出來用。
這是 document:
http://search.cpan.org/dist/HTML-Tree/lib/HTML/TreeBuilder.pm
另外這是很久前研究時寫的 sample code:
my $tree = HTML::TreeBuilder->new;
$tree->parse($htmlcode);
# Get <img src="http://blog.blah" alt="some" style="...">...</a>
my $node = $tree->look_down('_tag', 'img',
'src', qr{^http://blog\.},
'alt', 'blah',
'style', '...');
print $node->as_HTML;
另外一個方法是寫 template,然後用 Template::Extract 把資料拉出來,不過
這也是個邪惡的大密技就是了...
--
※ 發信站: 批踢踢實業坊(ptt.cc)
◆ From: 140.113.54.119
推
05/19 14:33, , 1F
05/19 14:33, 1F
討論串 (同標題文章)
本文引述了以下文章的的內容:
完整討論串 (本文為第 2 之 2 篇):
Perl 近期熱門文章
PTT數位生活區 即時熱門文章