[問題] 找出重複數據 平均後刪掉其餘重複列

看板R_Language作者 (yaowei)時間10年前 (2014/09/30 14:36), 編輯推噓1(104)
留言5則, 1人參與, 最新討論串1/2 (看更多)
[軟體熟悉度]: 新手 [問題敘述]: 如題目 由於同一欄內有重複的項目 抓出來後平均做為代表數值 其餘的刪掉 (同一項目名稱只能出現一次) [程式範例]: (原來) (處理後) Name data1 data2 Name data1 data2 A 1 1 A 2 2 A 2 2 B 1 1 A 3 3 C 2 2 B 1 1 → D 4.5 3.5 C 2 2 E 3 3 D 4 4 D 5 3 E 1 1 E 3 3 E 5 5 我知道怎麼在裡面配對 但刪掉這部分怕會影響for loop處理i的問題 不知道該怎麼寫比較好 -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 140.112.25.100 ※ 文章網址: http://www.ptt.cc/bbs/R_Language/M.1412058961.A.FE7.html

09/30 18:36, , 1F
tapply(d$data1, d$Name, mean) # d是個data frame
09/30 18:36, 1F

09/30 18:37, , 2F
之後再自己拚湊看看。
09/30 18:37, 2F

09/30 18:39, , 3F
或是用 aggregate() 也可以。
09/30 18:39, 3F

09/30 18:40, , 4F
aggregate(cbind(data1,data2), data=d, FUN=mean)
09/30 18:40, 4F

09/30 18:40, , 5F
其中的 d 就是原 data frame。
09/30 18:40, 5F
文章代碼(AID): #1KAazH_d (R_Language)
文章代碼(AID): #1KAazH_d (R_Language)