討論串[問題] 使用CUDA來擷取矩陣中部分值
共 10 篇文章

推噓0(0推 0噓 0→)留言0則,0人參與, 最新作者aada (aada)時間16年前 (2010/02/23 03:23), 編輯資訊
0
0
0
內容預覽:
我試著把index改成你的寫法, 但是輸出結果不對, 於是我就照原來的寫法,. 下面是我的程式, movaIM5是取大矩陣(ex.4x4)上與下面(3x4)矩陣,movaIM6是取左右,. 而最後我將輸出結果,請問一下我在kernel中這樣的寫法OK嗎(我目前只注意到結果,. 想請教是不是有比較好的
(還有1810個字)

推噓0(0推 0噓 0→)留言0則,0人參與, 最新作者lgen7604時間16年前 (2010/02/22 20:27), 編輯資訊
0
0
0
內容預覽:
因為你現在呼叫kernel只有1個block 所以blockIdx.x和blockIdx.y都會是0. 不過還是寫正確一點比較好. index應該是這樣吧[row*(NNx-1)+col]. --. 發信站: 批踢踢實業坊(ptt.cc). ◆ From: 122.120.40.234.

推噓0(0推 0噓 0→)留言0則,0人參與, 最新作者aada (aada)時間16年前 (2010/02/22 02:32), 編輯資訊
0
0
0
內容預覽:
我改了一下, 但是最後結果少了最後一行,. 我曾試過在模擬印出kernel程式的結果,. 結果沒錯, 為什麼到後來傳回host的結果是錯的呢?. 以及請問一下, 我丟到kernel的變數矩陣大小可以不一樣嗎?. 謝謝. __global__ void movaIM11(float *input1,
(還有937個字)

推噓0(0推 0噓 7→)留言7則,0人參與, 最新作者lgen7604時間16年前 (2010/02/21 20:57), 編輯資訊
0
0
0
內容預覽:
前文我刪掉了 重點放在下面CUDA的程式碼. ^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^. 要用到二維的blockDim和blockIdx的話請注意宣告時的維度. dim3 block(WIDTH,HEIGHT);. movaIM11<<<1, bloc

推噓3(3推 0噓 7→)留言10則,0人參與, 最新作者aada (aada)時間16年前 (2010/02/21 17:43), 編輯資訊
0
0
0
內容預覽:
請問一下, 我想使用CUDA來執行取矩陣中某一個範圍的值作為心的矩陣來運算,. 例如, 有一個矩陣A, 取出矩陣A的部分作為矩陣B, 以及矩陣C. 矩陣 A 矩陣 B 矩陣 c. 0 1 2 3 1 2 3 0 1 2. 4 5 6 7 5 6 7 4 5 6. 8 9 10 11 9 10 11
(還有1009個字)