Re: [問題] 關於資料處理
※ 引述《AaronHicks ( )》之銘言:
: [問題類型]:
:
: 程式諮詢(我想用R 做某件事情,但是我不知道要怎麼用R 寫出來)
: [軟體熟悉度]:
: 入門(寫過其他程式,只是對語法不熟悉)
: [問題敘述]:
: 我有一筆屬性是data table的資料
: 裡面記錄顧客的消費明細
: 格式是這樣
: 購買物品 數量
: 客人A 蔬菜 1
: 客人A 雞肉 2
: 客人B 水果 2
: 客人B 牛肉 1
: 我想把他換成下面這個形式
: 蔬菜 水果 雞肉 牛肉
: 客人A 1 0 2 0
: 客人B 0 2 0 1
: 有嘗試用tidyr裡面的spread來轉置
: 但會變成
: 蔬菜 水果 雞肉 牛肉
: 客人A 1 0 0 0
: 客人A 0 0 2 0
: 請問有什麼方法可以讓客人不重複?
library(dplyr)
library(tidyr)
DF <- read.table(textConnection("
客人 購買物品 數量
客人A 蔬菜 1
客人A 雞肉 2
客人B 水果 2
客人B 牛肉 1 "), header = TRUE)
spread(DF, 購買物品, 數量, fill = 0)
# 客人 水果 牛肉 蔬菜 雞肉
# 1 客人A 0 0 1 2
# 2 客人B 2 1 0 0
客人當成一個column就可以了~~~
--
R資料整理套件系列文:
magrittr #1LhSWhpH (R_Language) https://goo.gl/72l1m9
data.table #1LhW7Tvj (R_Language) https://goo.gl/PZa6Ue
dplyr(上.下) #1LhpJCfB,#1Lhw8b-s (R_Language) https://goo.gl/I5xX9b
tidyr #1Liqls1R (R_Language) https://goo.gl/i7yzAz
pipeR #1NXESRm5 (R_Language) https://goo.gl/zRUISx
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 118.170.44.206
※ 文章網址: https://www.ptt.cc/bbs/R_Language/M.1493122806.A.843.html
討論串 (同標題文章)
R_Language 近期熱門文章
PTT數位生活區 即時熱門文章