PTT數位生活區 / Python

[問題] regular expression with utf-8

看板Python作者hsnucsc (hsnugo)時間16年前 (2010/06/03 11:22)推噓2(2推 0噓 1→)

留言3則, 2人參與討論串1/1

最近在學習python regular expression的部份希望可以parse出類似'7~8級', '7-8級', '7～8級', '7到8級', 這類的pattern 但是發現在使用utf-8 encode的情況下 re.findall('\d+[-~～]\d+', '7～8級') 是沒辦法找到的因為'～'　= '\xe2\x88\xbc' 在[]內被視為三個不同的character 如果是Unicode re.findall(u'\d+[-~～]\d+', u'7～8級') 就可以雖然有google到一個回應建議不要用utf-8的byte stream做regular expression的search或match 不過因為要parse的XML檔, 讀入時的encoding方法是utf-8 想問說有沒有辦法省掉將utf-8轉成unicode的步驟就直接使用re做parsing 謝謝 -- ※ 發信站: 批踢踢實業坊(ptt.cc) ◆ From: 61.230.225.18

推

06/03 15:15, , 1^F

06/03 15:15, 1^F

推

09/05 11:09, , 2^F

09/05 11:09, 2^F

→

09/05 11:11, , 3^F

09/05 11:11, 3^F

‣ 返回看板[ Python ] 程設

‣ 更多 hsnucsc 的文章

文章代碼(AID): #1C1n_yla (Python)

Python 近期熱門文章

2

11

[問題] openpyxl到底能不能調整全局Font？

1月前, 05/07

7

21

[問題] super() 與MRO 鏈斷裂問題

3月前, 02/24

3

13

[問題] vscode的debug模式不用考慮中文路徑

4月前, 02/01

1

15

[問題] skimage.io.imread()讀圖檔底色是黃色？

5月前, 12/28

2

4

[閒聊] 有人要合購股票pythony資料庫finlab嗎?

5月前, 12/23

1

1

[問題] python 3.14 free thread build

7月前, 10/29

1

13

[問題] 關於正規表示法的r'\1'?

7月前, 10/22

6

9

[問題] 請問有人用過OMIA PLUS影音平台自學嗎?

8月前, 10/09

更多近期熱門文章 >>

PTT數位生活區即時熱門文章

5

5

[賣/新北/面交] 獨顯主機,32RAM,250G SSD

[ HardwareSale ]

5小時前, 06/10

-6

9

[問題] iphone現在都不會出特別色嗎

5小時前, 06/10

10

30

Re: [情報] iOS 27 Beta

6小時前, 06/09

5

16

[心得] Samsung Galaxy Buds4 Pro

6小時前, 06/09

7

98

[菜單] 30k遊戲機(升級)

[ PC_Shopping ]

6小時前, 06/09

6

18

[開箱] 閒魚硬碟1t$250 hc620 + x86飛牛nas$199r

[ PC_Shopping ]

7小時前, 06/09

6

26

[問題] iphone新手機預購

8小時前, 06/09

6

52

[請益] PCIe m.2轉接卡和m.2 SSD散熱片

[ PC_Shopping ]

8小時前, 06/09

更多即時熱門文章 >>

‣ 返回看板[ Python ] 程設

‣ 更多 hsnucsc 的文章

文章代碼(AID): #1C1n_yla (Python)