Re: [問題] R的向量運算
※ 引述《a78998042a (Benjimine)》之銘言:
: [問題類型]:
: 程式諮詢(我想用R 做某件事情,但是我不知道要怎麼用R 寫出來)
: [軟體熟悉度]:
: 使用者(已經有用R 做過不少作品)
: [問題敘述]:
: 我需要將程式向量化
: 使用迴圈、apply系列的函數太慢了
: 但不用apply又做不出來
: 想詢問大家的經驗
: [程式範例]:
: ###vactor的問題
: #我想將一個向量分別加上一個數字
: x = 1:3
: y = rep(0, 3)
: #我想得到類似下面結果,但不用apply, 不用迴圈的做法
: sapply(x, function(x) y + x, simplify = FALSE)
: [[1]]
: [1] 1 1 1
: [[2]]
: [1] 2 2 2
: [[3]]
: [1] 3 3 3
我猶豫了一下要怎麼回你XD
不過我覺得sapply, lapply夠快了,而且for也很好用
我寫了一個簡單的測試,我不認為這會是你程式速度的瓶頸:
PS: 相信你的y不是全部0,不然用mapply + rep最快
y <- 1:3e4
x <- 1:1e4
st <- proc.time()
z1 <- sweep(array(y, c(length(y), length(x))), 2, x, '+')
proc.time() - st
# user system elapsed
# 8.72 0.45 9.19
st <- proc.time()
z2 <- sapply(x, function(xi) y + xi)
proc.time() - st
# user system elapsed
# 3.32 0.48 3.83
all.equal(z1, z2) # TRUE
st <- proc.time()
z12 <- sweep(matrix(rep(y, length(x)), length(y)), 2, x, '+')
proc.time() - st
# user system elapsed
# 8.93 1.10 10.05
all.equal(z1, z12)
st <- proc.time()
z22 <- sapply(x, function(xi) y + xi, simplify = FALSE)
proc.time() - st
# user system elapsed
# 0.58 0.45 1.05
st <- proc.time()
z3 <- lapply(x, function(xi) y + xi)
proc.time() - st
# user system elapsed
# 0.53 0.17 0.70
all.equal(z22, z3) # TRUE
st <- proc.time()
z4 <- vector('list', length(x))
for (i in seq_along(x))
z4[[i]] <- y + x[i]
proc.time() - st
# user system elapsed
# 0.61 0.04 0.65
all.equal(z4, z3) # TRUE
: ###array的問題
: #我想將array不同維度的物件,扣除不同數字
: temp.ar = array(matrix(0, 2, 3), c(2, 3, 2))
: #我想得到類似下面的結果
: sapply(1:2, function(x)temp.ar[,,x] + x,simplify = FALSE)
: [[1]]
: [,1] [,2] [,3]
: [1,] 1 1 1
: [2,] 1 1 1
: [[2]]
: [,1] [,2] [,3]
: [1,] 2 2 2
: [2,] 2 2 2
: #另一個問題是,sapply會將物件轉成list,增加後續處理上的難度
: #例如我無法直接對list取round
: #使用sapply的simplify又會將破壞結構,之後可能需要再重新架構
: #但如果結構是array就可以直接做一些函數運算
: #不知道大家有這方面的經驗可以分享嗎
: #謝謝!
arr <- array(0, c(2, 3, 1e4))
st <- proc.time()
z <- sweep(arr, 3, 1:1e4, '+')
proc.time() - st
# user system elapsed
# 0.00 0.02 0.02
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 140.109.74.87
※ 文章網址: https://www.ptt.cc/bbs/R_Language/M.1458548400.A.66C.html
※ 編輯: celestialgod (140.109.74.87), 03/21/2016 16:44:54
推
03/21 18:41, , 1F
03/21 18:41, 1F
→
03/21 18:42, , 2F
03/21 18:42, 2F
→
03/21 18:43, , 3F
03/21 18:43, 3F
→
03/21 18:44, , 4F
03/21 18:44, 4F
→
03/21 18:45, , 5F
03/21 18:45, 5F
→
03/21 18:47, , 6F
03/21 18:47, 6F
→
03/21 18:48, , 7F
03/21 18:48, 7F
→
03/21 18:50, , 8F
03/21 18:50, 8F
→
03/21 18:51, , 9F
03/21 18:51, 9F
→
03/21 18:53, , 10F
03/21 18:53, 10F
→
03/21 18:55, , 11F
03/21 18:55, 11F
我不知道你為什麼覺得有一定的基礎物件語法能夠幫助你提速
就以你提的第一例子來說,迴圈跟sapply/lapply就很夠用了
包成一個函數或是因此去寫一個c++ function並沒有太大的意義
如果你主要的對象都是矩陣或是陣列的話
那麼你依靠sapply系列函數並沒有什麼缺點
慢都會在BLAS的部分,而非R語法的問題
至於對行列運算的apply,都可以用sweep取代
其他加速方式還有使用多執行緒、用C++
在R上面,就我的認知而言,for跟sapply已經是很好用的工具了
剩下的是你對矩陣的熟悉度,去做manipulation,而非語法或是函數問題
這部分,你要有明確的例子,才有辦法給你一些建議
※ 編輯: celestialgod (140.109.73.232), 03/21/2016 20:18:43
推
03/21 20:51, , 12F
03/21 20:51, 12F
→
03/21 20:52, , 13F
03/21 20:52, 13F
→
03/21 20:52, , 14F
03/21 20:52, 14F
推
03/21 21:15, , 15F
03/21 21:15, 15F
討論串 (同標題文章)
R_Language 近期熱門文章
PTT數位生活區 即時熱門文章