PTT數位生活區 / RegExp (正規表示式 Regular Expression)

[心得] 重複抓特定html標籤資料

看板RegExp (正規表示式 Regular Expression)作者felaray (法拉魚)時間12年前 (2013/06/19 13:07)推噓2(2推 0噓 3→)

留言5則, 3人參與討論串1/1

前天開始研究RexExp,這東西令人惱羞.做了兩天以後才弄好想要的東西所以在此分享給大家.語法為C# 說明:html是用HttpWebRequest抓出來的網頁資料, 目標是抓出<dt>...</dt>裡面的資料 string pattern = @"<dt[^>]*?>(?<word>.*?)</dt>"; Regex regex = new Regex(pattern, RegexOptions.IgnoreCase); MatchCollection matches = regex.Matches(html); int index = 0; foreach (Match match in matches) { GroupCollection groups = match.Groups; string x = groups["word"].Value.Trim(); if (x != "") //因為抓到不明空白,所以在此解決 Response.Write( x + "<BR>"); 要條列序號的話就把++index加入上行 } 輸出資料 1: absolute bolometric magnitude 絕對熱星等 2: absolute zero 絕對零度，絕對零點 3: acceleration 加速度 4: acceleration of gravity 重力加速度 5: accretion 吸積 6: Achernar 水委一 7: achondrites 無球粒隕石 8: achromatic lens 消色差透鏡 9: albedo 反照率 10: Alcaid 搖光 11: Alcor 輔、開陽伴星 12: Alcyone 昂宿六 Html原始碼(節錄) <dt><b>absolute zero 絕對零度，絕對零點 </b></dt> --

推

03/15 22:27,

03/15 22:27

→

03/15 22:28,

03/15 22:28

-- ※ 發信站: 批踢踢實業坊(ptt.cc) ◆ From: 220.229.239.158 ※ 編輯: felaray 來自: 220.229.239.158 (06/19 13:09)

推

06/19 14:31, , 1^F

06/19 14:31, 1^F

→

06/19 14:54, , 2^F

06/19 14:54, 2^F

推

08/19 21:19, , 3^F

08/19 21:19, 3^F

→

08/19 21:19, , 4^F

08/19 21:19, 4^F

→

01/09 19:20, , 5^F

01/09 19:20, 5^F

‣ 返回看板[ RegExp ] 程設

‣ 更多 felaray 的文章

文章代碼(AID): #1HmJo0VC (RegExp)

RegExp 近期熱門文章

1

3

Re: [請問] regexp的replace？

9月前, 04/07

2

9

[閒聊] 原來正規表示法可以用來找質數

3年前, 09/26

2

9

[問題] 有沒有辦法用 Regex 檢查對話框？

4年前, 11/26

2

10

[問題] Atomic Group 的原理是什麼?

4年前, 11/15

4

14

[問題] 怎抓到全部的()

4年前, 10/09

8

15

[問題] 取代引號中的特定字串

4年前, 10/06

1

5

[問題] 網頁元素問題

5年前, 11/25

4

12

[問題] 請問一題正則表達式

5年前, 11/08

更多近期熱門文章 >>

PTT數位生活區即時熱門文章

-2

8

[新聞] 6G起步晚？電信業擬通盤檢討5G資費

8小時前, 01/07

2

23

[問題] 海外（歐洲）3G 關閉後，台星門號無訊號

8小時前, 01/07

-3

10

[菜單] 新手的電腦請益

[ PC_Shopping ]

9小時前, 01/06

0

7

[閒聊] 張哥：這幾張5090都得了一種病，叫通病

[ PC_Shopping ]

12小時前, 01/06

-10

10

[心得] 台灣外約很安心日本外約很刺激全都超順已刪文

[ PC_Shopping ]

17小時前, 01/06

5

9

[情報] 微星推出全新 PRO MAX 系列不是iPhone

[ PC_Shopping ]

17小時前, 01/06

14

55

[情報] Intel 正式推出Core Ultra 3 美國製造18A

[ PC_Shopping ]

17小時前, 01/06

3

5

[情報] AMD Ryzen AI 400 系列處理器

[ PC_Shopping ]

17小時前, 01/06

更多即時熱門文章 >>

‣ 返回看板[ RegExp ] 程設

‣ 更多 felaray 的文章

文章代碼(AID): #1HmJo0VC (RegExp)