[運算] 多層for迴圈簡化 與 GPU加速

看板MATLAB作者 (別再睡了起床了愛麗)時間7年前 (2017/12/19 02:09), 7年前編輯推噓2(207)
留言9則, 2人參與, 7年前最新討論串1/2 (看更多)
最近遇到一個問題目前只想到用多層for來處理,想請問有沒有辦法簡化 問題大概是這樣,有兩個m*n*k的三維矩陣atot和atotcc,atotcc是atot的共軛複數 https://imgur.com/9Eou21X
其中每一個k方向的紅框atot(1,1,:) atotcc(2,3,:)這些視為一個個向量,目標是把所 有atot中的m*n個向量和atotcc中的m*n個向量分別做內積得到(m*n)^2個值,再取總合 目前的程式大概是這樣 m=15; n=19; k=10000; ar=randn(n,m,k); ai=randn(n,m,k); atot=ar+i*ai; atotcc=conj(atot); acsd=zeros(n,m,n,m)+i*zeros(n,m,n,m); tic; for ix=1:m for iy=1:n for ixc=1:m for iyc=1:n acsd(iy,ix,ixc,iyc)=sum(bsxfun(@times,atot(iy,ix,:),atotcc(iyc,ixc,:))); end end end end toc tic; acsdsum=sum(sum(sum(sum(acsd)))); toc 說是內積但是不用dot是因為有複數用起來有些問題,一維的話我知道可以取轉置,但是 寫成(iy,ix,:)這種形式不太知道怎麼做所以先用sum配上bsxfun或.* 感覺寫這麼多層迴圈不是很有效率,而且也不適合用gpu加速(目前只會變慢),但這應該是 很適合平行化的計算(上面的程式在執行時會自動在cpu上平行化),因為所有的內積以及 內積中的運算分別都是獨立的 在這先謝謝板上先進的不吝指教 感恩 -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 140.114.253.34 ※ 文章網址: https://www.ptt.cc/bbs/MATLAB/M.1513620596.A.E0A.html 也可以先變成(m*n)*k的二維矩陣 https://imgur.com/OD6Cu3O
m=15; n=19; k=10000; mtn=m*n; ar=randn(mtn,k); ai=randn(mtn,k); atot=ar+i*ai; atotcc=conj(atot); tic; for ixc=1:mtn for iyc=1:mtn acsd(iyc,ixc)=sum(atot(ixc,:).*atotcc(iyc,:)); end end toc tic; acsdsum=sum(sum(acsd)); toc (可能是要轉置的關係,寫成dot acsd(iyc,ixc)=dot(atot(ixc,:)',atotcc(iyc,:)); 會更慢) 這樣就少了兩層for,用cpu速度看起來是差不多,gpu的話寫成這樣比四層快非常多,不 過還是比cpu慢,不知道有沒有辦法再簡化 m=15; n=19; k=10000; mtn=m*n; ar=randn(mtn,k,'gpuArray'); ai=randn(mtn,k,'gpuArray'); atot=ar+i*ai; atotcc=conj(atot); acsd=zeros(mtn,mtn,'gpuArray')+i*zeros(mtn,mtn,'gpuArray'); tic; for ixc=1:mtn for iyc=1:mtn acsd(iyc,ixc)=sum(atot(ixc,:).*atotcc(iyc,:)); end end toc tic; acsdsum=sum(sum(acsd)); toc 感恩 ※ 編輯: Absolitude (140.114.253.34), 12/19/2017 02:47:19 ※ 編輯: Absolitude (140.114.253.34), 12/19/2017 02:53:38

12/19 05:27, 7年前 , 1F
atot=randn(m*n,k)+1i*randn(m*n,k);
12/19 05:27, 1F

12/19 05:27, 7年前 , 2F
acsdsum=sum(sum(atot*atot'));
12/19 05:27, 2F
謝謝 我震驚到說不話.. ※ 編輯: Absolitude (140.114.253.159), 12/19/2017 12:24:55 雖然一開始沒說,但是給了一點P比以示謝意,幫助太多 我覺得我矩陣都白學了.. ※ 編輯: Absolitude (140.114.253.159), 12/19/2017 12:27:33

12/19 15:40, 7年前 , 3F
之前用的時候都沒用到複數,沒想到轉置後還會變共軛
12/19 15:40, 3F

12/19 20:50, 7年前 , 4F
你畫的圖很精美,證明你完全知道自己想算什麼,也用到了一
12/19 20:50, 4F

12/19 20:50, 7年前 , 5F
些vectorize的技巧,像是2維變1維以及bsxfun
12/19 20:50, 5F

12/19 20:53, 7年前 , 6F
你只是不知道兩件事,
12/19 20:53, 6F

12/19 20:53, 7年前 , 7F
1.矩陣相乘可以看成向量內積的推廣。
12/19 20:53, 7F

12/19 20:54, 7年前 , 8F
2.複數向量怎麼做內積。
12/19 20:54, 8F

12/19 20:54, 7年前 , 9F
有興趣可以去翻一下線性代數的書,裡面有提到這些事
12/19 20:54, 9F
謝謝你的建議 ※ 編輯: Absolitude (140.114.253.151), 12/20/2017 03:19:45 比起一開始把MATLAB當C那樣寫,現在大致了解MATLAB要用什麼行事才會快,不過常常 想不到從何下手,大概也只能多練習了 ※ 編輯: Absolitude (140.114.253.151), 12/20/2017 03:21:18
文章代碼(AID): #1QE0HquA (MATLAB)
文章代碼(AID): #1QE0HquA (MATLAB)