[問題] 關於找出符號問題

看板RegExp (正規表示式 Regular Expression)作者 (plom)時間17年前 (2008/02/12 11:51), 編輯推噓2(204)
留言6則, 2人參與, 最新討論串1/1
請教各位了, 這是 ascii 的符號範圍: asccii=re.compile(r'([\x09\x0A\x0D\x20-\x7E])') 請問有人知道全形 utf8 標點符號的範圍嗎? 謝謝! 需求就是在一段文字內找出所有全形和半形的符號, 但不包括英文字母. -- ※ 發信站: 批踢踢實業坊(ptt.cc) ◆ From: 59.120.40.123

02/12 23:03, , 1F
標點喔...U+20xx有一些 U+FExx有一些 U+FFxx也有一些
02/12 23:03, 1F

02/12 23:03, , 2F
看你想要哪些...(U+20xx如‘“… U+FExx如︵︶︷︸
02/12 23:03, 2F

02/12 23:05, , 3F
U+FFxx則是ASCII字元的全形版)
02/12 23:05, 3F

02/12 23:05, , 4F
忘了引號了 它們在U+30xx
02/12 23:05, 4F

02/12 23:06, , 5F
當然以上並不是全部都是 也不是只有這些地方有
02/12 23:06, 5F

02/15 01:56, , 6F
有支援\p的話,可參考 http://0rz.tw/023ES
02/15 01:56, 6F
文章代碼(AID): #17iHVFWl (RegExp)
文章代碼(AID): #17iHVFWl (RegExp)