Re: [問題] 資料長<->寬變換

看板R_Language作者 (天)時間9年前 (2016/08/13 13:08), 9年前編輯推噓0(001)
留言1則, 1人參與, 最新討論串2/2 (看更多)
※ 引述《DrRd (就這樣吧)》之銘言: : [問題類型]: : : 意見調查(我對R 有個很棒的想法,想問問大家的意見) : : [軟體熟悉度]: : : 入門(寫過其他程式,只是對語法不熟悉) : [問題敘述]: : : 要將寬型的資料轉成長型的資料,但是要合併成的新變項有兩個 : 以iris為例 : 本來iris的資料長這樣 : | Sepal.Length | Sepal.Width | Petal.Length | Petal.Width | Species | : |:------------:|:-----------:|:------------:|:-----------:|:-------:| : | 5.1 | 3.5 | 1.4 | 0.2 | setosa | : | 4.9 | 3.0 | 1.4 | 0.2 | setosa | : | 4.7 | 3.2 | 1.3 | 0.2 | setosa | : | 4.6 | 3.1 | 1.5 | 0.2 | setosa | : 我想要轉成 : | Species | SorP.x | Length | Width | : |:-------:|:------------:|:------:|:-----:| : | setosa | Sepal | 5.1 | 3.5 | : | setosa | Sepal | 5.1 | 3.0 | : | setosa | Pepal | 5.1 | 3.2 | : | setosa | Pepal | 5.1 | 3.1 | : | setosa | Sepal | 5.1 | 3.6 | : 目前我想到的作法是先弄出兩個長期的資料,一個是Length另一個是Width : 然後再把兩個merge起來,請問大家有沒有什麼其他的方法?可以不用先弄成兩個資料? : : [程式範例]: : : data("iris") : head(iris) : library(tidyr);library(dplyr) : aa <- merge( : gather(iris[-c(2,4)],key = SorP, value = Length, Sepal.Length, Petal.Length), : gather(iris[-c(1,3)],key = SorP, value = Width, Sepal.Width, Petal.Width), : by.x = "Species", by.y = "Species") : : [環境敘述]: : : R version 3.3.0 (2016-05-03) : Platform: x86_64-apple-darwin13.4.0 (64-bit) : Running under: OS X 10.11.6 (El Capitan) : : [關鍵字]: : : 資料格式、tidyr 好讀版:http://pastebin.com/Lei4AzsU 兩個方法都可以達成,重點是unique key - id的建立 1. data.table library(data.table) library(pipeR) resDT <- iris %>>% data.table %>>% transform(Species = as.character(Species), id = 1:nrow(.)) %>>% melt(id = 5:6, measure = c(1:4), variable.factor = FALSE) %>>% `[`( , `:=`(c("partName", "measure"), tstrsplit(variable, "\\."))) %>>% dcast.data.table(Species + partName + id~ measure, sum, value.var = "value") %>>% `[`( , id := NULL) # Species partName Length Width # 1: setosa Petal 1.4 0.2 # 2: setosa Petal 1.4 0.2 # 3: setosa Petal 1.3 0.2 # 4: setosa Petal 1.5 0.2 # 5: setosa Petal 1.4 0.2 # --- # 296: virginica Sepal 6.7 3.0 # 297: virginica Sepal 6.3 2.5 # 298: virginica Sepal 6.5 3.0 # 299: virginica Sepal 6.2 3.4 # 300: virginica Sepal 5.9 3.0 2. dplyr + tidyr library(pipeR) library(dplyr) library(tidyr) resTbl <- iris %>>% tbl_df %>>% mutate(id = 1:nrow(.)) %>>% gather(variable, value, -Species, -id) %>>% separate(variable, c("partName", "measure")) %>>% spread(measure, value) %>>% select(-id) # Source: local data frame [300 x 4] # # Species partName Length Width # <fctr> <chr> <dbl> <dbl> # 1 setosa Petal 1.4 0.2 # 2 setosa Sepal 5.1 3.5 # 3 setosa Petal 1.4 0.2 # 4 setosa Sepal 4.9 3.0 # 5 setosa Petal 1.3 0.2 # 6 setosa Sepal 4.7 3.2 # 7 setosa Petal 1.5 0.2 # 8 setosa Sepal 4.6 3.1 # 9 setosa Petal 1.4 0.2 # 10 setosa Sepal 5.0 3.6 # .. ... ... ... ... -- R資料整理套件系列文: magrittr #1LhSWhpH (R_Language) http://tinyurl.com/j3ql84c data.table #1LhW7Tvj (R_Language) http://tinyurl.com/hr77hrn dplyr(上) #1LhpJCfB (R_Language) http://tinyurl.com/jtg4hau dplyr(下) #1Lhw8b-s (R_Language) tidyr #1Liqls1R (R_Language) http://tinyurl.com/jq3o2g3 -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 36.233.82.44 ※ 文章網址: https://www.ptt.cc/bbs/R_Language/M.1471064884.A.2D4.html ※ 編輯: celestialgod (36.233.82.44), 08/13/2016 13:18:14

08/13 21:52, , 1F
十分詳細,我再研究一下spread。感謝版主
08/13 21:52, 1F
文章代碼(AID): #1NhgiqBK (R_Language)
討論串 (同標題文章)
本文引述了以下文章的的內容:
完整討論串 (本文為第 2 之 2 篇):
文章代碼(AID): #1NhgiqBK (R_Language)