[問題] 多筆資料運算Pearson相關系數
[問題類型]:
程式諮詢(我想用R 做某件事情,但是我不知道要怎麼用R 寫出來)
[軟體熟悉度]:
新手(沒寫過程式,R 是我的第一次)
[問題敘述]:
各位先進好:
我有50萬筆資料,每一筆資料有30組(X,Y)的數據,
想要針對每一筆的X,Y運算Pearson相關係數,
資料格式,如下:
Name X1 X2 ... X30 Y1 Y2 ... Y30
.
.
.
.
共50萬筆
欲輸出格式為:
(Name) (Pearson's cor)
因為沒有太多的程式撰寫經驗,
目前的想法是:
先抓取每一列1~30個值為X向量,31~60個值為Y向量,
進行cor(X, Y, use="complete", method="pearson")運算Pearson相關係數,
再利用迴圈運算50萬筆資料。
請問先進,我應該如何開始撰寫這樣的語法呢?
還是我應該改變匯入資料的格式呢?
再麻煩各位先進指教!
謝謝大家~
[環境敘述]:
R version 3.2.0 (2015-04-16)
Platform: i386-w64-mingw32/i386 (32-bit)
[關鍵字]:
Peearson相關係數
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 175.96.226.195
※ 文章網址: https://www.ptt.cc/bbs/R_Language/M.1433990237.A.474.html
※ 編輯: Shadowy (175.96.226.195), 06/11/2015 10:41:03
※ 編輯: Shadowy (175.96.226.195), 06/11/2015 10:42:45
討論串 (同標題文章)
以下文章回應了本文 (最舊先):
完整討論串 (本文為第 1 之 3 篇):
R_Language 近期熱門文章
PTT數位生活區 即時熱門文章