討論串[問題] 使用CUDA來擷取矩陣中部分值
共 10 篇文章
內容預覽:
請問一下L大, 我試著將矩陣A(2M*2N)的第一行與第一列加入0值獲得矩陣B,. 我直接宣告出一個(2M+1*2N+1)大小的0矩陣, 接著將矩陣A貼到矩陣B上,. 以及試著將它參數化(想要做512x512矩陣), 但我寫的kernel function好像沒辦法,. 謝謝. 矩陣A 矩陣B. 1
(還有4794個字)
內容預覽:
從你的描述來看你是想把矩陣A(NNy x NNx) 擷取出一部份(NNy x NNx-1). 再放入新的矩陣B (NNy x NNx+1). 請特別注意矩陣的維度 還有矩陣的row,col及CUDA中x,y的關係. #include <stdio.h>. #include <stdlib.h>. #
(還有3018個字)
內容預覽:
請問L大一下, 我現在想把我取出的矩陣A(16x15),. 貼到一個新的矩陣,矩陣B中(16x17),. 我目前遇到的問題是有的值會少貼, 導致後面的順序就錯了. 矩陣A 矩陣B 矩陣C(正確). 1 2 3 0 0 0 0 0 1 2 3 0. 4 5 6 0 0 0 0 0 4 5 6 0. 7
(還有3138個字)
內容預覽:
沒錯. 說實話我完全不知道你的blocks和threads為什麼要取這種數字啊. 要是矩陣的大小改了怎麼辦?. 從你乘出來的結果看也沒有好像處理完512*512的矩陣啊. 下面是我把你之前的範例改成任意大小的矩陣都能處理的type. NNx NNy BLOCK_SIZE 都可以任意設 (只要沒有ov
(還有2341個字)
內容預覽:
我執行的結果正常啊. 取上下左右的部份都沒問題. #include <stdio.h>. #include <stdlib.h>. #include <string.h>. #include <cuda_runtime.h>. #include <cutil.h>. #define NNx 4. #
(還有1776個字)