[分享] R的parallel套件 (snow, foreach)
[關鍵字]: foreach, snow, snowfall
[出處]: http://chingchuan-chen.github.io/posts/2016/11/26/R-parallel-pkgs
[重點摘要]:
有些程式不能全部靠RcppParallel加速
所以想說只能靠R的一些平行套件來解決
但是平行套件其實不少,那哪一個又有比較好的performance?
有興趣可以到出處網址去看
--
R資料整理套件系列文:
magrittr #1LhSWhpH (R_Language) https://goo.gl/OBto1x
data.table #1LhW7Tvj (R_Language) https://goo.gl/QFtp17
dplyr(上.下) #1LhpJCfB,#1Lhw8b-s (R_Language) https://goo.gl/GcfNoP
tidyr #1Liqls1R (R_Language) https://goo.gl/pcq5nq
pipeR #1NXESRm5 (R_Language) https://goo.gl/cDIzTh
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 36.235.43.180
※ 文章網址: https://www.ptt.cc/bbs/R_Language/M.1480145613.A.F57.html
推
11/26 21:22, , 1F
11/26 21:22, 1F
推
11/26 21:26, , 2F
11/26 21:26, 2F
→
11/26 22:21, , 3F
11/26 22:21, 3F
→
11/26 22:22, , 4F
11/26 22:22, 4F
推
11/26 22:26, , 5F
11/26 22:26, 5F
→
11/26 22:27, , 6F
11/26 22:27, 6F
→
11/26 22:28, , 7F
11/26 22:28, 7F
dplyr 跟 plyr 要處理的問題不太一樣
dplyr會比較偏重在data.frame上
plyr則是任意資料類型,dplyr也是單線程在做
在一些case下,plyr::dlply + rbindlist會比 dplyr, data.table快上不少
但是這也是要depends on 資料量
至於C++,則是看你有沒有能力刻出演算法而決定
如果可以,當然用C++做加速是一個不錯的方案
中間還包含你要去學C++語法,使用Rcpp相關套件的時間付出
對於有些人來說不是那麼合算下,可以不去考慮
有些人可能需要學個半年C++才刻的出比用R還快的演算法來使用,這部分很難講...
所以你如果真的有遇到程式效率問題,就嘗試花時間去碰C++
看怎麼用C++去解決你的效率問題吧
至於multi-core建模,現在h2o滿方便,試試看用那個應該就能解決很多問題了
推
11/26 23:38, , 8F
11/26 23:38, 8F
→
11/26 23:38, , 9F
11/26 23:38, 9F
推
11/26 23:44, , 10F
11/26 23:44, 10F
→
11/26 23:45, , 11F
11/26 23:45, 11F
有用過,我就是用了覺得還不錯,才會寫上來XD
※ 編輯: celestialgod (36.235.43.180), 11/27/2016 03:07:09
推
11/27 07:51, , 12F
11/27 07:51, 12F
→
11/27 09:34, , 13F
11/27 09:34, 13F
推
11/27 10:01, , 14F
11/27 10:01, 14F
→
11/27 10:02, , 15F
11/27 10:02, 15F
推
11/27 12:18, , 16F
11/27 12:18, 16F
→
11/27 12:18, , 17F
11/27 12:18, 17F
→
11/27 12:40, , 18F
11/27 12:40, 18F
推
11/27 14:47, , 19F
11/27 14:47, 19F
→
11/27 14:48, , 20F
11/27 14:48, 20F
→
11/27 14:50, , 21F
11/27 14:50, 21F
推
11/27 18:04, , 22F
11/27 18:04, 22F
推
11/27 18:39, , 23F
11/27 18:39, 23F
R_Language 近期熱門文章
PTT數位生活區 即時熱門文章