Re: [問題] 資料整理的問題

看板R_Language作者 (天)時間9年前 (2016/12/05 17:56), 9年前編輯推噓1(101)
留言2則, 2人參與, 最新討論串3/5 (看更多)
※ 引述《ppp1987 (ppp)》之銘言: : [問題類型]: : 程式諮詢(我想用R 做某件事情,但是我不知道要怎麼用R 寫出來) : [軟體熟悉度]: : 入門(寫過其他程式,只是對語法不熟悉) : [問題敘述]: : 資料形式 : ID Day X : 1 1 0.5 : 1 3 0.1 : 1 4 0.3 : 1 7 0.5 : 1 9 0.5 : 1 11 0.2 : 1 14 0.5 : 2 1 0.1 : 2 2 0.4 : 2 5 0.8 : 2 9 0.7 : 2 11 0.1 : 2 13 0.2 : 現在我的資料每個ID(有100多個ID)每天有一筆觀測值(但不一定每天有) : 我現在想要算每個ID當天的前七天有觀測值的平均 : 例如 : (ID=1,Day=9) Xhat=(0.5+0.3+0.1)/3 : (ID=2,Day=11) Xhat=(0.7+0.8)/2 : 現在已經用for迴圈跑出結果(但是很慢 2萬多筆約30分鐘) : 想請教各位大大有沒有比較快的方法 : 謝謝 cy大的方法應該比較快XD 不過我還是把我的方法寫出來... library(data.table) library(pipeR) library(zoo) library(plyr) DT <- fread('ID Day X 1 1 0.5 1 3 0.1 1 4 0.3 1 7 0.5 1 9 0.5 1 11 0.2 1 14 0.5 2 1 0.1 2 2 0.4 2 5 0.8 2 9 0.7 2 11 0.1 2 13 0.2') DT[ , Day := factor(Day, levels = seq(min(DT$Day), max(DT$Day)))] mean2 <- function(x) { if (length(x) == 1) return(NA) mean(head(x, length(x) - 1), na.rm = TRUE) } DT2 <- dcast.data.table(DT, ID ~ Day, sum, fill = NA, drop = FALSE, value.var = "X") meanDT <- DT2[ , 2:ncol(DT2)] %>>% as.matrix %>>% t %>>% rollapply(8, mean2, partial = TRUE, align = "right") %>>% data.table %>>% melt.data.table(measure.var = 1:ncol(.), variable.name = "ID", value.name = "x_mean", variable.factor = FALSE) %>>% `[`(j = Day := 1:(ncol(DT2)-1), by = .(ID)) %>>% `[`(j = ID := as.integer(mapvalues(ID, paste0("V", 1:nrow(DT2)), DT2$ID))) merge(DT, meanDT, by = c("ID", "Day")) # ID Day X x_mean # 1: 1 1 0.5 NA # 2: 1 3 0.1 0.5000000 # 3: 1 4 0.3 0.3000000 # 4: 1 7 0.5 0.3000000 # 5: 1 9 0.5 0.3000000 # 6: 1 11 0.2 0.4333333 # 7: 1 14 0.5 0.4000000 # 8: 2 1 0.1 NA # 9: 2 2 0.4 0.1000000 # 10: 2 5 0.8 0.2500000 # 11: 2 9 0.7 0.6000000 # 12: 2 11 0.1 0.7500000 # 13: 2 13 0.2 0.4000000 稍微改一下cy大的code,讓他跟我的output一致 做了一點benchmark,code: http://pastebin.com/Msib1dEh 我的作法會明顯慢一點,三萬列差大概一秒,cy大的做法比較好 -- R資料整理套件系列文: magrittr #1LhSWhpH (R_Language) https://goo.gl/72l1m9 data.table #1LhW7Tvj (R_Language) https://goo.gl/PZa6Ue dplyr(上.下) #1LhpJCfB,#1Lhw8b-s (R_Language) https://goo.gl/I5xX9b tidyr #1Liqls1R (R_Language) https://goo.gl/i7yzAz pipeR #1NXESRm5 (R_Language) https://goo.gl/zRUISx -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 111.246.28.152 ※ 文章網址: https://www.ptt.cc/bbs/R_Language/M.1480931811.A.FB5.html ※ 編輯: celestialgod (111.246.28.152), 12/05/2016 18:25:19

12/05 22:25, , 1F
感謝好讀版~推
12/05 22:25, 1F

12/06 16:11, , 2F
感謝版主~
12/06 16:11, 2F
※ 編輯: celestialgod (111.246.24.125), 12/07/2016 18:14:32
文章代碼(AID): #1OHJdZ-r (R_Language)
文章代碼(AID): #1OHJdZ-r (R_Language)