PTT數位生活區 / Perl

Re: [問題]請問'如何濾出網頁表格資料呢?'

看板Perl作者DarkKiller (System hacked)時間19年前 (2007/05/18 16:59)推噓1(1推 0噓 0→)

留言1則, 1人參與討論串2/2 (看更多)

※ 引述《lestersd (小事不做大事難成)》之銘言： : 請問, 比方說這個網頁 : http://tinyurl.com/3dujed : 我要如何才能將表格的資料濾出來使用呢? : ( 序號, 註記, 書名, etc. ) : 不好意思, 可能是很新手的問題^^; 感謝各位;) 不... 這一點都不新手... :p 你可以用 HTML::Tree 提供的 TreeBuilder 把整份 HTML document 丟進去，把樹建出來以後抽出來用。這是 document： http://search.cpan.org/dist/HTML-Tree/lib/HTML/TreeBuilder.pm 另外這是很久前研究時寫的 sample code： my $tree = HTML::TreeBuilder->new; $tree->parse($htmlcode); # Get <img src="http://blog.blah" alt="some" style="...">...</a> my $node = $tree->look_down('_tag', 'img', 'src', qr{^http://blog\.}, 'alt', 'blah', 'style', '...'); print $node->as_HTML; 另外一個方法是寫 template，然後用 Template::Extract 把資料拉出來，不過這也是個邪惡的大密技就是了... -- ※ 發信站: 批踢踢實業坊(ptt.cc) ◆ From: 140.113.54.119

推

05/19 14:33, , 1^F

05/19 14:33, 1^F

‣ 返回看板[ Perl ] 程設

‣ 更多 DarkKiller 的文章

文章代碼(AID): #16JMiDMI (Perl)

討論串 (同標題文章)

本文引述了以下文章的的內容：

1

1

[問題]請問'如何濾出網頁表格資料呢?'

19年前, 05/17

完整討論串 (本文為第 2 之 2 篇)：

排序：最新先 | 最舊先 | 留言數

1

1

Re: [問題]請問'如何濾出網頁表格資料呢?'

19年前, 05/18

1

1

[問題]請問'如何濾出網頁表格資料呢?'

19年前, 05/17

在新視窗開啟完整討論串 (共2篇)

Perl 近期熱門文章

1

7

Re: [問題] sleep與-e搭配應用

1年前, 06/19

2

15

[問題] 如何改善大文件的讀寫效能

2年前, 07/12

1

2

Re: [問題] 參照變數宣告及記憶體位置問題

3年前, 02/13

1

2

[問題] 參照變數宣告及記憶體位置問題

3年前, 02/07

3

5

Learing Perl 第八版中文版出版了

4年前, 06/22

2

4

[請益] 請教terminal 餵正規表示法給perl問題

5年前, 04/10

1

9

[問題] 是不是要放棄perl了

5年前, 03/02

1

1

[問題] 請問如何建立新的Row？(代po)

5年前, 11/23

更多近期熱門文章 >>

PTT數位生活區即時熱門文章

0

12

Re: [新聞] 知名智能手機品牌一加即將撤出美國及歐洲

2小時前, 07/14

11

46

[請益] 三頻WIFI 7推薦

[ PC_Shopping ]

4小時前, 07/14

16

54

[請益] 被顯卡遮檔的Pciex1插槽

[ PC_Shopping ]

4小時前, 07/14

4

17

[開箱] 全漢入門主力電供，FSP VIC GM全模電供

[ PC_Shopping ]

5小時前, 07/14

6

19

[新聞] 知名智能手機品牌一加即將撤出美國及歐洲

5小時前, 07/14

30

89

[閒聊] Intel Arc A380 一天心得....

[ PC_Shopping ]

7小時前, 07/14

3

9

[情報] iOS 27 Public Beta

7小時前, 07/14

17

58

[請益] 9800X3D搭配 B650 or B850

[ PC_Shopping ]

8小時前, 07/14

更多即時熱門文章 >>

‣ 返回看板[ Perl ] 程設

‣ 更多 DarkKiller 的文章

文章代碼(AID): #16JMiDMI (Perl)