[問題] Data frame 篩選

看板R_Language作者 (1)時間3年前 (2020/09/26 22:32), 編輯推噓8(806)
留言14則, 5人參與, 3年前最新討論串1/1
圖為 https://imgur.com/a/lyA1TRJ 想請問高手 A_IQ <- mean (as.matrix (subset(X, bloodtype=="A", IQ))); A_IQ B_IQ <- mean (as.matrix (subset(X, bloodtype=="B", IQ))); B_IQ AB_IQ <- mean (as.matrix (subset(X, bloodtype=="AB", IQ))); AB_IQ O_IQ <- mean (as.matrix (subset(X, bloodtype=="O", IQ))); O_IQ X為以上圖 目前只算出各血型的平均IQ, 但不知道要怎麼顯示誰才是最高的IQ EX:A血型的平均IQ最高 -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 1.169.78.42 (臺灣) ※ 文章網址: https://www.ptt.cc/bbs/R_Language/M.1601130772.A.755.html

09/26 23:00, 3年前 , 1F
先對血型做groupby的mean之後再找平均的最大值?
09/26 23:00, 1F

09/26 23:09, 3年前 , 2F
↑是
09/26 23:09, 2F

09/27 00:09, 3年前 , 3F
X %>% group_by(bloodtype) %>% summarize(meanIQ = mean(I
09/27 00:09, 3F

09/27 00:09, 3年前 , 4F
Q)) %>% top_n(1,meanIQ)
09/27 00:09, 4F

09/27 00:10, 3年前 , 5F
(以上為使用dplyr套件做法)
09/27 00:10, 5F

09/27 22:24, 3年前 , 6F
算分組平均的內建方法有aggregate()或tapply()
09/27 22:24, 6F

09/27 22:25, 3年前 , 7F
之後再找最大值大概就max或sort或order來做
09/27 22:25, 7F

10/02 16:41, 3年前 , 8F
dplyr套件的arrange(data,data$IQ)
10/02 16:41, 8F

10/02 16:43, 3年前 , 9F
你應該先把全部資料令成data,方便後續分析
10/02 16:43, 9F

10/02 16:52, 3年前 , 10F
X<-data.table(X)
10/02 16:52, 10F

10/02 17:21, 3年前 , 11F
library(dplyr)
10/02 17:21, 11F

10/02 17:40, 3年前 , 12F
X_analysis<-X%>%arrange(IQ)%>% group_by(bloodtype)
10/02 17:40, 12F

10/02 20:57, 3年前 , 13F
%>%mutate(mean=mean(IQ))
10/02 20:57, 13F

10/03 00:32, 3年前 , 14F
我不太懂summarize用法,請問用法謝謝
10/03 00:32, 14F
文章代碼(AID): #1VRr4KTL (R_Language)
文章代碼(AID): #1VRr4KTL (R_Language)