Re: [問題]請問'如何濾出網頁表格資料呢?'

看板Perl作者 (System hacked)時間18年前 (2007/05/18 16:59), 編輯推噓1(100)
留言1則, 1人參與, 最新討論串2/2 (看更多)
※ 引述《lestersd (小事不做大事難成)》之銘言: : 請問, 比方說這個網頁 : http://tinyurl.com/3dujed : 我要如何才能將表格的資料濾出來使用呢? : ( 序號, 註記, 書名, etc. ) : 不好意思, 可能是很新手的問題^^; 感謝各位;) 不... 這一點都不新手... :p 你可以用 HTML::Tree 提供的 TreeBuilder 把整份 HTML document 丟進去, 把樹建出來以後抽出來用。 這是 document: http://search.cpan.org/dist/HTML-Tree/lib/HTML/TreeBuilder.pm 另外這是很久前研究時寫的 sample code: my $tree = HTML::TreeBuilder->new; $tree->parse($htmlcode); # Get <img src="http://blog.blah" alt="some" style="...">...</a> my $node = $tree->look_down('_tag', 'img', 'src', qr{^http://blog\.}, 'alt', 'blah', 'style', '...'); print $node->as_HTML; 另外一個方法是寫 template,然後用 Template::Extract 把資料拉出來,不過 這也是個邪惡的大密技就是了... -- ※ 發信站: 批踢踢實業坊(ptt.cc) ◆ From: 140.113.54.119

05/19 14:33, , 1F
感恩;Q
05/19 14:33, 1F
文章代碼(AID): #16JMiDMI (Perl)
文章代碼(AID): #16JMiDMI (Perl)