PTT數位生活區 / RegExp (正規表示式 Regular Expression)

[問題] 如何抓取網頁原始碼中單引號內的內容

看板RegExp (正規表示式 Regular Expression)作者liataian (T-PANY FOREVER)時間11年前 (2014/12/15 13:56)推噓0(0推 0噓 1→)

留言1則, 1人參與討論串1/1

各位好，想請教一下我想用python3的正則式抓取某個網頁原始碼中的某個單引號中的內容該內容長度非常長，可能長度大於100000 比起網頁原始碼中其他單引號中的內容還要長很多我想說先抓取原始碼中的所有單引號中的內容接著再用長度來判斷長度大於100000的內容才符合條件想問這樣的正則式應該怎麼下呢? 我目前是寫如下這樣 import urllib.parse,urllib.request html = urllib.request.urlopen("該網址") #html形態為物件 s_html = html.read().decode('utf-8') #s_html形態為字串將html物件轉成s_html字串後才可以用正則式去parse 不過這邊我就不知道怎麼寫正則式去抓出s_html裡面的所有單引號中的內容了@@ 還請各位指點一下，謝謝!! -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 140.118.155.39 ※ 文章網址: http://www.ptt.cc/bbs/RegExp/M.1418623015.A.3FB.html ※ 編輯: liataian (140.118.155.39), 12/15/2014 14:01:43

→

12/15 14:44, , 1^F

12/15 14:44, 1^F

‣ 返回看板[ RegExp ] 程設

‣ 更多 liataian 的文章

文章代碼(AID): #1KZdWdFx (RegExp)

RegExp 近期熱門文章

1

3

Re: [請問] regexp的replace？

1年前, 04/07

2

9

[閒聊] 原來正規表示法可以用來找質數

3年前, 09/26

2

9

[問題] 有沒有辦法用 Regex 檢查對話框？

4年前, 11/26

2

10

[問題] Atomic Group 的原理是什麼?

4年前, 11/15

4

14

[問題] 怎抓到全部的()

4年前, 10/09

8

15

[問題] 取代引號中的特定字串

4年前, 10/06

1

5

[問題] 網頁元素問題

5年前, 11/25

4

12

[問題] 請問一題正則表達式

5年前, 11/08

更多近期熱門文章 >>

PTT數位生活區即時熱門文章

9

33

[心得] 暴力熊石墨烯 KryoSheet 散熱片

[ PC_Shopping ]

4小時前, 07/12

22

54

[情報] 接上 LG 螢幕竟被強塞 McAfee 廣告！Alie

[ PC_Shopping ]

5小時前, 07/12

6

7

[問題] LG G5 展示機能買入手嗎

[ Digitalhome ]

11小時前, 07/12

2

10

[估價] EVGA GeForceRTX3090 FTW3 UltraGaming

[ HardwareSale ]

11小時前, 07/12

5

5

[合購] 卡巴斯基專業版 20台/1年

13小時前, 07/12

5

12

[閒聊] AMD Strixhalo ROCm 7.13 對LLM 有所提

[ PC_Shopping ]

14小時前, 07/12

61

186

Re: [新聞] 北海道飛高雄泰獅航班機出事！機艙內行

15小時前, 07/12

4

5

[賣/台北/面交] TP-Link Archer BE550路由器

[ HardwareSale ]

16小時前, 07/12

更多即時熱門文章 >>

‣ 返回看板[ RegExp ] 程設

‣ 更多 liataian 的文章

文章代碼(AID): #1KZdWdFx (RegExp)