PTT數位生活區 / RegExp (正規表示式 Regular Expression)

Re: [問題] 抓取網頁資訊

看板RegExp (正規表示式 Regular Expression)作者giacch (小ａ)時間17年前 (2008/11/02 03:51)推噓1(1推 0噓 1→)

留言2則, 2人參與討論串2/2 (看更多)

※ 引述《MrAshan (一輩子)》之銘言： : <li class=g><h3 class=r><a : href="http://mi.nou.edu.tw/workshop/workshop_910718.htm" : 以上是我想要抓取的條件是有class=g 跟 class=r時才抓取網頁 : 我表示式寫成 : (?s)class=g><a\\s+href\\s*=\\s*\"?(.*?)[\"|>] : 沒辦法抓取我要的網頁 : 但若我改成 : (?s)class=r><a\\s+href\\s*=\\s*\"?(.*?)[\"|>] : 是有辦法可是在google網頁中它會連庫存網頁也會抓進來 : 我只要單一乾淨的主網頁不要子網頁 : 有沒有辦法?? #!/usr/bin/perl while(<>) { while(s/<li class=g><h3 class=r><a href="([^"]+)//) { print $1 . "\n"; } } -- ※ 發信站: 批踢踢實業坊(ptt.cc) ◆ From: 118.232.236.185

推

11/05 18:59, , 1^F

11/05 18:59, 1^F

→

11/05 23:05, , 2^F

11/05 23:05, 2^F

‣ 返回看板[ RegExp ] 程設

‣ 更多 giacch 的文章

文章代碼(AID): #193BDQvG (RegExp)

討論串 (同標題文章)

本文引述了以下文章的的內容：

0

6

[問題] 抓取網頁資訊

17年前, 10/30

完整討論串 (本文為第 2 之 2 篇)：

排序：最新先 | 最舊先 | 留言數

1

2

Re: [問題] 抓取網頁資訊

17年前, 11/02

0

6

[問題] 抓取網頁資訊

17年前, 10/30

在新視窗開啟完整討論串 (共2篇)

RegExp 近期熱門文章

1

3

Re: [請問] regexp的replace？

1年前, 04/07

2

9

[閒聊] 原來正規表示法可以用來找質數

3年前, 09/26

2

9

[問題] 有沒有辦法用 Regex 檢查對話框？

4年前, 11/26

2

10

[問題] Atomic Group 的原理是什麼?

4年前, 11/15

4

14

[問題] 怎抓到全部的()

4年前, 10/09

8

15

[問題] 取代引號中的特定字串

4年前, 10/06

1

5

[問題] 網頁元素問題

5年前, 11/25

4

12

[問題] 請問一題正則表達式

5年前, 11/08

更多近期熱門文章 >>

PTT數位生活區即時熱門文章

8

31

Re: [新聞] 包內行動電源未使用突爆炸自燃！　女傻

11小時前, 07/12

14

39

[心得] 暴力熊石墨烯 KryoSheet 散熱片

[ PC_Shopping ]

12小時前, 07/12

37

92

[情報] 接上 LG 螢幕竟被強塞 McAfee 廣告！Alie

[ PC_Shopping ]

13小時前, 07/12

6

7

[問題] LG G5 展示機能買入手嗎

[ Digitalhome ]

20小時前, 07/12

2

10

[估價] EVGA GeForceRTX3090 FTW3 UltraGaming

[ HardwareSale ]

20小時前, 07/12

5

5

[合購] 卡巴斯基專業版 20台/1年

22小時前, 07/12

7

15

[閒聊] AMD Strixhalo ROCm 7.13 對LLM 有所提

[ PC_Shopping ]

22小時前, 07/12

69

213

Re: [新聞] 北海道飛高雄泰獅航班機出事！機艙內行

23小時前, 07/12

更多即時熱門文章 >>

‣ 返回看板[ RegExp ] 程設

‣ 更多 giacch 的文章

文章代碼(AID): #193BDQvG (RegExp)