Re: [問題] grid生樣本 避免for迴圈

看板R_Language作者 (阿龍)時間5年前 (2019/04/07 10:51), 編輯推噓0(000)
留言0則, 0人參與, 最新討論串4/4 (看更多)
※ 引述《celestialgod (天)》之銘言: : 1. Vectorize用的mapply,其實還是迴圈,而且表現更糟 : 2. rt沒有辦法直接執行原PO想要的那種方式,你可以自己用Rcpp刻一個 : 3. 花時間查資料,有時候不如看文件或是source code來的有效 : Vectorize直接看應該不難找到重點 : rt可以直接看文件 : 會看到df degrees of freedom (> 0, maybe non-integer). df = Inf is allowed. : 這裡很明顯告訴你他不能用vector of degrees of freedom.... : 下面我比較一下幾種做法: : n <- 20 : theta <- seq(0, 1, len=100) + 0.001 # add small value to avoid warning : for_loop_rt <- function(n, theta) { : stopifnot(length(n) == 1, abs(n - floor(n)) < 1e-8) : X <- matrix(NA, n, length(theta)) : for (i in seq_along(theta)) : X[ , i] <- rt(n, theta[i]) : return(X) : } : library(compiler) : for_loop_rt_compiled <- cmpfun(for_loop_rt) : rt_vectorized <- Vectorize(rt) : library(microbenchmark) : microbenchmark( : sapply = sapply(theta, function(t) rt(20, 1/t)), : vectorized = rt_vectorized(rep(n, length(theta)), theta, ncp = rep(0, : length(theta))), : for_loop = for_loop_rt(n, theta), : for_loop_cmpfun = for_loop_rt_compiled(n, theta) : ) : # Unit: microseconds : # expr min lq mean median uq max neval : # sapply 556.8 576.10 597.278 584.30 594.25 1639.1 100 : # vectorized 898.6 923.45 1041.179 936.45 961.45 2637.4 100 : # for_loop 546.4 557.00 649.992 564.85 571.65 5844.1 100 : # for_loop_cmpfun 541.9 558.65 679.358 566.45 573.85 2290.1 100 : 這結果,很諷刺地告訴你用Vectorize只是讓事情更糟而已XDDDDDD : 然後反而用for loop最快.... 這件事情其實我有在板上談過.... : matrix操作 R真的很快.... 試著相信R一下^.< : ※ 引述《locka (locka)》之銘言: : : 感謝 celestialgod 版主大大提點: : : 以前以為 *apply 家族的函數就已經是向量化(vectorized)的寫法了 : : 查了資料才發現其實底層背後還是有 for 迴圈 (覺得震撼啊...) : : 試試看這樣的寫法 : : theta <- seq(0,1,len=100) : : df <- rep(19,len=100) : : n <- rep(20,len=100) : : vrt <- Vectorize(rt) : : x <- vrt(n=n, df=df, ncp=1/theta) : : 於是 x[,1] ... x[,100] 就是100個 n 等於20 然後對應各自 delta 值的 t 分配樣本了 : : (但是不知道 df, n 的預先定義有沒有意義?) : : 請版上各位高手再指點~ 謝謝大家 : : ====== : : 補充: : : 但還是有查到 *apply function 的好處: : : 1. 程式易讀性 : : 2. 會 pre-allocate 向量的記憶體空間 : : 2. 只影響區域變數不會改變全域變數 : : ref: https://www.r-bloggers.com/vectorization-in-r-why/ 感謝大家回答 其實最後我選擇用第一篇貼文的lapply來做 我的敘述不太好 我並不是不想用迴圈 只是不想寫for 迴圈 對於我很晚回復這件事我也感到抱歉 畢竟大家都好熱烈的討論 果然R版真的是藏龍臥虎XDD -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 140.114.237.189 ※ 文章網址: https://www.ptt.cc/bbs/R_Language/M.1554605495.A.026.html
文章代碼(AID): #1SgMMt0c (R_Language)
文章代碼(AID): #1SgMMt0c (R_Language)