[問題] 請問 unicode or utf-8 區分繁簡中文
看板RegExp (正規表示式 Regular Expression)作者worldxxi (風)時間15年前 (2010/04/16 11:52)推噓3(3推 0噓 2→)留言5則, 3人參與討論串1/1
我查了一下中文字的範圍(\u4e00-\u9a05),
如果要區分出日文(\u0800-\u4e00)比較容易,因為範圍有錯開,
但是要分出繁體中文還是簡體中文就沒辦法,我用word的符號表看,
是交錯在一起的,最後我用的方法是:把要檢查的字串轉成big-5,轉不出來的
就含有不是繁體中文的字,然後再去處理,可是感覺很鳥,有人知道比較
好一點作法嗎? 弄不出來我感覺自己好弱 Q_Q
---------------------------------------------------------------------------
另外有個小疑問,我在網路上找到一個正規表示式的網站,如下:
http://www.rubular.com/
為什麼我用[\u4e00-\u9a05]去跑,反而是英文會通過,中文被濾掉了
[\u4e00-\u9a05]的意思不是說 如果有在這個字碼範圍的字出現就會match嗎?
一直google不到,有人知道嗎。
--
※ 發信站: 批踢踢實業坊(ptt.cc)
◆ From: 140.96.120.223
推
04/16 13:24, , 1F
04/16 13:24, 1F
→
04/16 13:33, , 2F
04/16 13:33, 2F
推
04/16 14:19, , 3F
04/16 14:19, 3F
推
04/18 01:34, , 4F
04/18 01:34, 4F
→
04/19 09:32, , 5F
04/19 09:32, 5F
RegExp 近期熱門文章
PTT數位生活區 即時熱門文章