Fw: [問題] [年月日...] 的 regular expression

看板RegExp (正規表示式 Regular Expression)作者時間8年前 (2016/07/31 23:25), 8年前編輯推噓3(3016)
留言19則, 2人參與, 最新討論串1/2 (看更多)
有string如下,大致上就是允許「年月日」這樣的順序, 有時可以沒有年,有時可以沒有日,但若是「年-日」 就應拆分成兩個日期。 我亂try 了一下,不太寫的出來,最像樣的如下。但「4年」 竟然抓不到,所以是錯的。6年7日也沒分開。 import re string = '1月 1日 2年 2月 2 日 3年3月 4年 5年5月 6年 7日' match = re.findall('([\d\s]+年)*([\d\s]+月)*([\d\s]+日)*', string) print(match) 執行結果 >>> [('', '1月', ' 1日'), (' 2年', ' 2月', ' 2 日'), (' 3年', '3月', ''), (' 5年', '5月', ''), (' 6年', '', ' 7日'), ('', '', '')] -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 114.136.83.16 ※ 文章網址: https://www.ptt.cc/bbs/Python/M.1469975924.A.007.html ※ 發信站: 批踢踢實業坊(ptt.cc) ※ 轉錄者: ggirls (114.136.83.16), 07/31/2016 23:25:29 ※ 編輯: ggirls (114.136.83.16), 07/31/2016 23:36:28

08/01 01:38, , 1F
08/01 01:38, 1F

08/01 01:38, , 2F
你用*而不是?,所以4年跟5年那個一起match了
08/01 01:38, 2F

08/01 01:45, , 3F
([\d\s]+年)?([\d\s]+月)?((?<!年)[\d\s]+日)?
08/01 01:45, 3F

08/01 01:46, , 4F
這樣應該可以
08/01 01:46, 4F

08/01 02:25, , 5F
謝謝。用*有點不適合。另一個要求是6年 7日應該要拆成兩組
08/01 02:25, 5F

08/01 02:25, , 6F
日期,有辦法做到嗎?
08/01 02:25, 6F

08/01 22:48, , 7F
我這個就可以拆成兩組了,你拿去試試看?
08/01 22:48, 7F

08/01 22:48, , 8F
就是在"日"那一組加了前面不能是"年"的條件
08/01 22:48, 8F

08/02 09:29, , 9F
抱歉,之前漏看了你加了這個條件。的確是可以拆成兩組了。
08/02 09:29, 9F

08/02 09:31, , 10F
目前在看有沒有可能不要比對出空的結果。例如
08/02 09:31, 10F

08/02 09:31, , 11F
(' 6年', '', ''), ('', '', ''), ('', '', '7日'),
08/02 09:31, 11F
※ 編輯: ggirls (42.72.25.216), 08/02/2016 09:35:03

08/02 09:35, , 12F
我用 Python3.4。
08/02 09:35, 12F
※ 編輯: ggirls (42.72.25.216), 08/02/2016 11:45:55

08/02 16:40, , 13F
這部分應該不太行,大部分處理regex capturing都是有
08/02 16:40, 13F

08/02 16:40, , 14F
()就會分配一個變數給他,不管有沒有抓到
08/02 16:40, 14F

08/02 16:41, , 15F
當然我不太熟Python,有可能有特定method可用
08/02 16:41, 15F

08/02 17:55, , 16F
6年 7日 間的 ('','',''),在年月日後再加入\s*?就可以避
08/02 17:55, 16F

08/02 17:55, , 17F
開,只是最後還是會產生一組空的。最後還是要全部刪一遍,
08/02 17:55, 17F

08/02 17:56, , 18F
沒什麼意義。
08/02 17:56, 18F

08/02 17:58, , 19F
你的解法算全面了。現在還在看s25的解法,有點卡關,呵。
08/02 17:58, 19F
文章代碼(AID): #1NdXXgTm (RegExp)
文章代碼(AID): #1NdXXgTm (RegExp)