PTT數位生活區 / C_and_CPP (C/C++)

Re: [問題] 使用CUDA來擷取矩陣中部分值

看板C_and_CPP (C/C++)作者lgen7604時間16年前 (2010/02/24 02:01)推噓0(0推 0噓 15→)

留言15則, 2人參與討論串7/10 (看更多)

→

,

→

,

沒錯

→

,

→

,

→

,

→

,

推

,

→

,

→

,

說實話我完全不知道你的blocks和threads為什麼要取這種數字啊要是矩陣的大小改了怎麼辦?

→

,

→

,

→

,

從你乘出來的結果看也沒有好像處理完512*512的矩陣啊下面是我把你之前的範例改成任意大小的矩陣都能處理的type NNx NNy BLOCK_SIZE 都可以任意設 (只要沒有overflow) #include <stdio.h> #include <stdlib.h> #include <string.h> #include <cuda_runtime.h> #include <cutil.h> #define NNx 16 #define NNy 16 #define BLOCK_SIZE 8 #define ALIGN 3 // 對齊printf用 __global__ void movaIM5(float *input1, float *output1) { int col = blockIdx.x*blockDim.x+threadIdx.x; int row = blockIdx.y*blockDim.y+threadIdx.y; if(col < NNx && row+1 < NNy) output1[row*NNx+col] = input1[(row+1)*NNx+col]; // 取下面矩陣 //if(col < NNx && row < (NNy-1)) // output1[row*NNx+col] = input1[row*NNx+col]; // 取上面矩陣 } __global__ void movaIM6(float *input1, float *output1) { int col = blockIdx.x*blockDim.x+threadIdx.x; int row = blockIdx.y*blockDim.y+threadIdx.y; if(col+1 < NNx && row < NNy) output1[row*(NNx-1)+col] = input1[row*NNx+col+1]; // 取右邊矩陣 //if(col < (NNx-1) && row < NNy) // output1[row*(NNx-1)+col] = input1[row*NNx+col]; // 取左邊矩陣 } int main(int argc, char* argv[]) { int i; float input[NNx*NNy]; float *d_input; for(i = 0; i < NNx*NNy; i++){ input[i] = i+1; if(i % NNx == 0) printf("\n"); else printf(" "); printf("%*.0f", ALIGN, input[i]); } printf("\n"); cudaMalloc((void**)&d_input, sizeof(float)*NNx*NNy); cudaMemcpy( d_input, input, sizeof(float)*NNx*NNy, cudaMemcpyHostToDevice ); float *d_IM5, *d_IM6; cudaMalloc((void**)&d_IM5, sizeof(float)*NNx*(NNy-1)); cudaMalloc((void**)&d_IM6, sizeof(float)*(NNx-1)*NNy); int bx = (NNx + BLOCK_SIZE - 1) / BLOCK_SIZE; int by = (NNy + BLOCK_SIZE - 1) / BLOCK_SIZE; dim3 blocks(bx,by); dim3 threads(BLOCK_SIZE,BLOCK_SIZE); movaIM5<<<blocks, threads>>>( d_input, d_IM5 ); movaIM6<<<blocks, threads>>>( d_input, d_IM6 ); float *IM5, *IM6; IM5 = (float*) malloc( sizeof(float)*NNx*(NNy-1) ); IM6 = (float*) malloc( sizeof(float)*(NNx-1)*NNy ); cudaMemcpy( IM5, d_IM5, sizeof(float)*NNx*(NNy-1), cudaMemcpyDeviceToHost ); cudaMemcpy( IM6, d_IM6, sizeof(float)*(NNx-1)*NNy, cudaMemcpyDeviceToHost ); for(i = 0; i < NNx*(NNy-1); i++){ if(i % NNx == 0) printf("\n"); else printf(" "); printf("%*.0f", ALIGN, IM5[i]); } printf("\n"); for(i = 0; i < (NNx-1)*NNy; i++){ if(i % (NNx-1) == 0) printf("\n"); else printf(" "); printf("%*.0f", ALIGN, IM6[i]); } printf("\n"); cudaFree(d_input); cudaFree(d_IM5); cudaFree(d_IM6); system("pause"); return 0; } -- ※ 發信站: 批踢踢實業坊(ptt.cc) ◆ From: 122.120.40.234

→

02/24 02:26, , 1^F

02/24 02:26, 1^F

→

02/24 02:27, , 2^F

02/24 02:27, 2^F

→

02/24 07:10, , 3^F

02/24 07:10, 3^F

→

02/24 07:13, , 4^F

02/24 07:13, 4^F

→

02/24 07:14, , 5^F

02/24 07:14, 5^F

※ 編輯: lgen7604 來自: 122.120.40.234 (02/24 07:22)

→

02/24 14:17, , 6^F

02/24 14:17, 6^F

→

02/24 14:19, , 7^F

02/24 14:19, 7^F

→

02/25 01:35, , 8^F

02/25 01:35, 8^F

→

02/25 01:35, , 9^F

02/25 01:35, 9^F

→

02/25 01:36, , 10^F

02/25 01:36, 10^F

→

02/25 01:36, , 11^F

02/25 01:36, 11^F

→

02/25 01:36, , 12^F

02/25 01:36, 12^F

→

02/25 01:37, , 13^F

02/25 01:37, 13^F

→

02/25 01:48, , 14^F

02/25 01:48, 14^F

→

02/25 01:49, , 15^F

02/25 01:49, 15^F

‣ 返回看板[ C_and_CPP ] 程設

‣ 更多 lgen7604 的文章

文章代碼(AID): #1BX1V_Sa (C_and_CPP)

討論串 (同標題文章)

完整討論串 (本文為第 7 之 10 篇)：

排序：最新先 | 最舊先 | 留言數

Re: [問題] 使用CUDA來擷取矩陣中部分值

16年前, 03/01

0

1

Re: [問題] 使用CUDA來擷取矩陣中部分值

16年前, 02/26

Re: [問題] 使用CUDA來擷取矩陣中部分值

16年前, 02/26

0

15

Re: [問題] 使用CUDA來擷取矩陣中部分值

16年前, 02/24

1

12

Re: [問題] 使用CUDA來擷取矩陣中部分值

16年前, 02/23

Re: [問題] 使用CUDA來擷取矩陣中部分值

16年前, 02/23

Re: [問題] 使用CUDA來擷取矩陣中部分值

16年前, 02/22

Re: [問題] 使用CUDA來擷取矩陣中部分值

16年前, 02/22

0

7

Re: [問題] 使用CUDA來擷取矩陣中部分值

16年前, 02/21

3

10

[問題] 使用CUDA來擷取矩陣中部分值

16年前, 02/21

在新視窗開啟完整討論串 (共10篇)

C_and_CPP 近期熱門文章

5

14

Re: [心得] 求質數的C++程式

2月前, 05/07

1

3

[心得] 求質數的C++程式已刪文

2月前, 05/06

1

1

[公告] bl2086 水桶

3月前, 04/28

7

20

[問題] c語言重複定義編譯錯誤

4月前, 03/28

1

12

[心得] 求質數的C++程式

4月前, 03/16

4

9

[心得] 求質數的C/C++程式

4月前, 03/07

6

34

[問題] bool變數一寫多讀需要鎖嗎

5月前, 02/11

13

21

Re: [問題] *p++ = *q++

6月前, 01/29

更多近期熱門文章 >>

PTT數位生活區即時熱門文章

3

6

[情報] iOS 26.6

1小時前, 07/28

8

32

[新聞] 北捷已支援三星/Google錢包交通快速模式

4小時前, 07/27

4

35

Re: [心得] iPhone沒有想像地那麼順暢

5小時前, 07/27

3

5

[賣/台北/皆可] AMD R7 7700 MPK

[ HardwareSale ]

5小時前, 07/27

5

71

[菜單] 80~85K 遊戲機

[ PC_Shopping ]

6小時前, 07/27

4

6

Re: [心得] SanDisk售後服務站產品更換分享

[ PC_Shopping ]

7小時前, 07/27

-4

7

[請益] 螢幕出現白邊

[ PC_Shopping ]

7小時前, 07/27

11

14

[ HardwareSale ]

8小時前, 07/27

更多即時熱門文章 >>

‣ 返回看板[ C_and_CPP ] 程設

‣ 更多 lgen7604 的文章

文章代碼(AID): #1BX1V_Sa (C_and_CPP)