[問題] 請教刪除中文字之間的空白

看板RegExp (正規表示式 Regular Expression)作者 (atrisk)時間5年前 (2018/08/06 05:37), 編輯推噓1(103)
留言4則, 1人參與, 5年前最新討論串1/1
大家好: 搜尋 ([一-龥,。:“”、‘’;\[\]])(\s+)([一-龥,。:“”、‘’;\[\]]) 替代 \1\3 上面的方法是我在網路上找到用來刪除中文字和中文字之間(包含些標點符號) 的多餘空白,因為使用OCR軟體辨識中文時一定會出現這現象。 一直沒辦法讓OCR軟體事先避免產生空格(OCR軟體好笨?!),所以只能事後做補救。 有些好奇項目1(和項目3)為何加\[\],不知有無特別的意義?是作者考慮不夠周詳嗎? 因為既然已經將[和]放入搜尋條件內了,為何不將類似的<和>等等也放進來? 謝謝! -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 36.228.235.168 ※ 文章網址: https://www.ptt.cc/bbs/RegExp/M.1533505053.A.856.html

08/06 21:54, 5年前 , 1F
正規表示式的 [ ] 是字元集, 表示 [ ] 之間的任一字元
08/06 21:54, 1F

08/06 21:55, 5年前 , 2F
例 [ABC] 表示 A 或 B 或 C, 但不含 [ ] 兩個字
08/06 21:55, 2F

08/06 21:57, 5年前 , 3F
不過我不太清楚為何目標是全型字元的這條正規式會想加入
08/06 21:57, 3F

08/06 21:57, 5年前 , 4F
半型的 [ ] 就是了
08/06 21:57, 4F
文章代碼(AID): #1RPsuTXM (RegExp)
文章代碼(AID): #1RPsuTXM (RegExp)