Re: [問題] 多個變數的迴圈如何處理?

看板R_Language作者 (天)時間9年前 (2016/12/24 09:54), 9年前編輯推噓2(206)
留言8則, 3人參與, 最新討論串4/6 (看更多)
※ 引述《lovedmagic (EricZou)》之銘言: : [問題類型]: : 程式諮詢(我想用R 做某件事情,但是我不知道要怎麼用R 寫出來) : [軟體熟悉度]: : 新手(沒寫過程式,R 是我的第一次) : [問題敘述]: : 目前我遇到的困難是我有A1~A270個變數,我每個變數都有大概五個數值, : 每個數值左側代表一個名稱,例如我A1這個變數裡面有 34 18 16 9 4五個值 : 然後每個數值對應到左側的名稱有A B C D E ,我想做的就是取出A1變數中 : 最大的那個值,然後再取出左側的ID,主要是要求出左側的ID,我要如何 : 讓迴圈把每個變數都跑過一次呢??? : 以下有錯誤範例 : [程式範例]: : fxck = data.frame() : for (i in 1:270){ : number[data$Ai==max(data$Ai)] : fxck <- rbind(number[Ai==max(Ai)],Ai) : print(fxck) : } : [關鍵字]: : 多個變數、迴圈 library(data.table) DT <- data.table(name = LETTERS[1L:5L], matrix(rnorm(270L * 5L), 5L)) setnames(DT, paste0("V", 1L:270L), paste0("A", 1L:270L)) # direct: data.table( variable = paste0("A", 1L:270L), ID = as.character(DT[ , lapply(.SD, function(x) name[which.max(x)]), .SDcols = A1:A270]) value = as.numeric(DT[ , lapply(.SD, max), .SDcols = A1:A270]) ) # variable ID value # 1: A1 B 0.5974676 # 2: A2 A 1.6205859 # 3: A3 E 0.9247647 # 4: A4 A 1.7180776 # 5: A5 D 1.2060909 # --- # 266: A266 C 0.4813518 # 267: A267 B 1.3096330 # 268: A268 B 0.4504671 # 269: A269 C 0.7401682 # 270: A270 D 2.9256539 # melt: library(pipeR) out <- melt.data.table(DT, 1) %>>% `[`( , .(ID = name[which.max(value)], value = max(value)) , by =.(variable)) # variable ID value # 1: A1 B 0.5974676 # 2: A2 A 1.6205859 # 3: A3 E 0.9247647 # 4: A4 A 1.7180776 # 5: A5 D 1.2060909 # --- # 266: A266 C 0.4813518 # 267: A267 B 1.3096330 # 268: A268 B 0.4504671 # 269: A269 C 0.7401682 # 270: A270 D 2.9256539 # melt 2: out <- melt.data.table(DT, 1) %>>% `[`( , `:=`(maxRow = rank(value) == length(value)), by = .(variable)) %>>% `[`(maxRow == TRUE) %>>% `[`( , maxRow := NULL) # tidyr + dplyr library(tidyr) library(dplyr) library(pipeR) gather(DT, variable, value, -name) %>>% group_by(variable) %>>% filter(rank(value) == length(value)) -- R資料整理套件系列文: magrittr #1LhSWhpH (R_Language) https://goo.gl/72l1m9 data.table #1LhW7Tvj (R_Language) https://goo.gl/PZa6Ue dplyr(上.下) #1LhpJCfB,#1Lhw8b-s (R_Language) https://goo.gl/I5xX9b tidyr #1Liqls1R (R_Language) https://goo.gl/i7yzAz pipeR #1NXESRm5 (R_Language) https://goo.gl/zRUISx -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 36.232.186.178 ※ 文章網址: https://www.ptt.cc/bbs/R_Language/M.1482544491.A.66E.html

12/24 15:12, , 1F
好高級的處理方法阿
12/24 15:12, 1F

12/24 15:32, , 2F
完全想像不到的高度
12/24 15:32, 2F

12/25 18:00, , 3F
跑了一次卡在.SDcols這邊,仍在研究
12/25 18:00, 3F
.SDcols就是你要放的變數,可以用字串向量表示:c("A1", "A2")這樣 ※ 編輯: celestialgod (1.165.234.127), 12/25/2016 18:36:05

12/26 10:22, , 4F
那請問C大我有270個變數就要手動輸入A1~A270嗎??
12/26 10:22, 4F

12/26 11:33, , 5F
看了一下還是不太能夠理解,我如果自己就有資料的話
12/26 11:33, 5F

12/26 11:34, , 6F
那我必須要自己把變數怎麼樣灌進去呢?單純的apply我試
12/26 11:34, 6F

12/26 11:35, , 7F
了apply(data , 2 , max )但是跑出來的依然不是我想要
12/26 11:35, 7F

12/26 18:52, , 8F
利用適當的方法填入就好了
12/26 18:52, 8F
文章代碼(AID): #1ONTLhPk (R_Language)
討論串 (同標題文章)
文章代碼(AID): #1ONTLhPk (R_Language)