Re: [問題] 使用正則來分割字串

看板R_Language作者 (天)時間9年前 (2016/01/09 15:49), 9年前編輯推噓2(200)
留言2則, 1人參與, 最新討論串2/2 (看更多)
※ 引述《corel (可羅)》之銘言: : 程式諮詢(我想用R 做某件事情,但是我不知道要怎麼用R 寫出來) : 大家好,小弟是R新手 : 假設我有二個字串的格式如下 : [1] "03Jan-05Jan201602Jul-04Jul2016" : [2] "06Jan-09Jan2016January 2017" : 我想要把它分離成 : "03Jan-05Jan2016" : "02Jul-04Jul2016" : 與 : "06Jan-09Jan2016" : "January 2017" : [1][2]只是舉例,其實想要處理字串的長度不一 : 小弟有想到用正則表示式來處理, 以下是我的寫法 : # 針對06Jan-09Jan2016格式設計的正則表示式方法 : s <- "03Jan-05Jan201602Jul-04Jul2016" : x <- gsub("(((0[1-9]|[12][0-9]|3[01]{2})[a-zA-Z]{3})- : ((0[1-9]|[12][0-9]|3[01]{2})[a-zA-Z]{3})[0-9]{4})",";",s) : x : # 只不過斷出來的字串是 : # OUT PUT ";;" : 其實我想要斷出來的字串是 : Result 1: : "03Jan-05Jan2016;02Jul-04Jul2016" : 或 : Result 2: : "03Jan-05Jan2016" : "02Jul-04Jul2016" : 在此,想請問大家, 在R之中是否有其它函數配合 正則表示式用來斷出 : Result 1或是 Result 2的結果? : 謝謝大家 x = c("03Jan-05Jan201602Jul-04Jul2016", "06Jan-09Jan2016January 2017") pattern1 = "(\\d{2}[a-zA-Z]{3}-\\d{2}[a-zA-Z]{3}\\d{4})" pattern2 = "([a-zA-Z]*\\s\\d{4})" regexpRes = regexec(paste0(pattern1, pattern1, '?', pattern2, '?'), x) lapply(regmatches(x, regexpRes), function(x){ x[nchar(x) > 0 & c(FALSE, rep(TRUE, length(x)-1))] }) # # [[1]] # [1] "03Jan-05Jan2016" "02Jul-04Jul2016" # # [[2]] # [1] "06Jan-09Jan2016" "January 2017" 後面新問題: 字串它可能會有 [1]"03Jan-05Jan201602Jul-04Jul201602Dec-04Dec2016" #三筆同格式 [2]"06Jan-09Jan2016January 2017" #二筆不同格式 [3]"May 201607Jan-08Jan2016" #二筆不同格式 [4]"07Jan-10Jan2016MAY 201706Jan-09Jan2018" #二筆不同格式 等多種組合... 要如何改寫讓程式可以自動判斷 http://pastebin.com/GRWaVSz1 -- R資料整理套件系列文: magrittr #1LhSWhpH (R_Language) http://tinyurl.com/1LhSWhpH data.table #1LhW7Tvj (R_Language) http://tinyurl.com/1LhW7Tvj dplyr(上) #1LhpJCfB (R_Language) http://tinyurl.com/1LhpJCfB dplyr(下) #1Lhw8b-s (R_Language) tidyr #1Liqls1R (R_Language) http://tinyurl.com/1Liqls1R -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 140.109.73.236 ※ 文章網址: https://www.ptt.cc/bbs/R_Language/M.1452325751.A.7A0.html

01/10 19:35, , 1F
感謝,請問有R的書推薦嗎?
01/10 19:35, 1F
請看置底... 另外regular expression 網路上很多教學,我也是看網路上教學而已... R in a nutshell是我唯一讀完的R書... ※ 編輯: celestialgod (180.218.152.118), 01/10/2016 22:00:38

01/10 22:41, , 2F
謝謝推薦
01/10 22:41, 2F
文章代碼(AID): #1MaBjtUW (R_Language)
討論串 (同標題文章)
文章代碼(AID): #1MaBjtUW (R_Language)