Re: [問題] data frame排序問題

看板R_Language作者 (天)時間9年前 (2016/11/01 20:49), 編輯推噓3(306)
留言9則, 2人參與, 最新討論串2/4 (看更多)
※ 引述《locka (locka)》之銘言: : [問題類型]: : : 程式諮詢(我想用R 做某件事情,但是我不知道要怎麼用R 寫出來) : : [問題敘述]: : 請簡略描述你所要做的事情,或是這個程式的目的 : 各位大大們好: : 想請教該怎麼把一個 data frame 裡面的row 按特定順序重新排序 : 例如說我有一個 list factory_list 是a,b,c,d,e : 然後我dataframe mydf是 : c 1000 : d 1500 : b 3000 : 我想要按照factory_list的順序重新排序變成 : a 0 : b 3000 : c 1000 : d 1500 : e 0 : 當list跟mydf長度一樣的時候我用 mydf[factory_list,] 可以正確排序 : 但當list長度不一樣的時候就會出現問題 : 想了很久實在不知道該從何下手,煩請各位大大求解惑了 m(__)m : *補充: : 原本想自己重現問題可是卻無法(結果不對) : 所以後來是用dput把原始data印出來再修改 : 詳細情形請見程式碼 : (不知道差別在哪裡...如果有大大知道為什麼也歡迎指點!) : 先謝謝大家了!!! : [程式範例]: : : http://ideone.com/YmgnI7 : : [關鍵字]: : : data frame, 排序 用merge跟match就可以達到你要的效果了 library(data.table) library(pipeR) factory_list_dt <- data.table(factory = c("台北", "台中", "高雄", "新竹", "台南")) dt1 <- data.table(factory = c("台北", "高雄", "新竹", "台中", "台南"), rev = c(9.23913043478261,16.3571428571429, 15.6206896551724, 15.0980392156863, 10)) dt1_sorted <- merge(factory_list_dt, dt1, by = "factory", all.x = TRUE) %>>% `[`(match(factory_list_dt$factory, factory)) print(dt1_sorted) # factory rev # 1: 台北 9.23913 # 2: 台中 15.09804 # 3: 高雄 16.35714 # 4: 新竹 15.62069 # 5: 台南 10.00000 dt2 <- data.table(factory = c("台北", "台中", "高雄"), rev = c(9.23913043478261,16.3571428571429, 15.6206896551724)) dt2_sorted <- merge(factory_list_dt, dt2, by = "factory", all.x = TRUE) %>>% `[`(match(factory_list_dt$factory, factory)) %>>% `[`(j = rev := ifelse(is.na(rev), 0, rev)) print(dt2_sorted) # factory rev # 1: 台北 9.23913 # 2: 台中 16.35714 # 3: 高雄 15.62069 # 4: 新竹 0.00000 # 5: 台南 0.00000 -- R資料整理套件系列文: magrittr #1LhSWhpH (R_Language) https://goo.gl/OBto1x data.table #1LhW7Tvj (R_Language) https://goo.gl/QFtp17 dplyr(上.下) #1LhpJCfB,#1Lhw8b-s (R_Language) https://goo.gl/GcfNoP tidyr #1Liqls1R (R_Language) https://goo.gl/pcq5nq pipeR #1NXESRm5 (R_Language) https://goo.gl/cDIzTh -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 36.234.177.169 ※ 文章網址: https://www.ptt.cc/bbs/R_Language/M.1478004578.A.2C7.html

11/01 20:57, , 1F
感謝celestialgod大大,回到家來研究看看
11/01 20:57, 1F

11/01 20:58, , 2F
不過如果我原始的factory_list不是data.table的話怎麼辦呢
11/01 20:58, 2F

11/01 21:01, , 3F
我原始的factory_list其實是用readOGR下載的地圖中的某欄位
11/01 21:01, 3F

11/01 21:02, , 4F
之後要拿來作圖 不確定把factory_list改成dt後能不能用
11/01 21:02, 4F

11/01 21:03, , 5F
我回家再試試看!!
11/01 21:03, 5F

11/01 22:07, , 6F
如果DT中有factory欄位 setkey(DT,factory) 然後你有原來
11/01 22:07, 6F

11/01 22:09, , 7F
的factorlist, DT[factorlist, nomatch=NA]再把NA改0即可
11/01 22:09, 7F

11/01 22:10, , 8F
如果只有dataframe, out<-df[match(lf,rownames(df)),]
11/01 22:10, 8F

11/01 22:12, , 9F
再把out[is.na(out)]<-0和rownames加回去應也不會太麻煩?
11/01 22:12, 9F
文章代碼(AID): #1O68zYB7 (R_Language)
討論串 (同標題文章)
文章代碼(AID): #1O68zYB7 (R_Language)