PTT數位生活區 / C_and_CPP (C/C++)

Re: [問題] 使用CUDA Share memory執行"點乘"比glo …

看板C_and_CPP (C/C++)作者lgen7604時間16年前 (2010/03/18 02:38)推噓6(6推 0噓 10→)

留言16則, 3人參與討論串2/3 (看更多)

主要是你寫的 Matrix_Point_Multiplication_SM 有問題你用for loop的功能是為了什麼? 能夠只執行一次的動作應該不需要重複執行好幾次吧我把 Matrix_Point_Multiplication_SM 改成如下呼叫的時候用 Matrix_Point_Multiplication_SM<<<blocks, threads, BLOCK_SIZE*BLOCK_SIZE*2*sizeof(float)>>>( d_input1, d_input2, d_output_s ); // ------------------- 用 share memory ------------------- // __global__ void Matrix_Point_Multiplication_SM( float *Ma, float *Nb, float *Pc ) { __shared__ float Msm[ BLOCK_SIZE ][ BLOCK_SIZE ]; __shared__ float Nsm[ BLOCK_SIZE ][ BLOCK_SIZE ]; int ty = threadIdx.y; int tx = threadIdx.x; int row = blockIdx.y * BLOCK_SIZE ; int col = blockIdx.x * BLOCK_SIZE ; if( (row+ty < NNy) && (col+tx < NNx) ) { // 矩陣搬移Share memory Msm[ ty ][ tx ] = Ma[ (row+ty)*NNx + (col+tx) ]; Nsm[ ty ][ tx ] = Nb[ (row+ty)*NNx + (col+tx) ]; // 矩陣運算Share memory Pc[ (row+ty)*NNx + (col+tx) ] = Msm[ ty ][ tx ] * Nsm[ ty ][ tx ]; } } -- -- ※ 發信站: 批踢踢實業坊(ptt.cc) ◆ From: 122.120.44.12

推

03/18 03:02, , 1^F

03/18 03:02, 1^F

推

03/18 03:09, , 2^F

03/18 03:09, 2^F

→

03/18 03:12, , 3^F

03/18 03:12, 3^F

推

03/18 03:14, , 4^F

03/18 03:14, 4^F

→

03/18 03:18, , 5^F

03/18 03:18, 5^F

→

03/18 03:19, , 6^F

03/18 03:19, 6^F

推

03/18 03:21, , 7^F

03/18 03:21, 7^F

→

03/18 03:22, , 8^F

03/18 03:22, 8^F

→

03/18 03:24, , 9^F

03/18 03:24, 9^F

→

03/18 03:25, , 10^F

03/18 03:25, 10^F

推

03/18 03:30, , 11^F

03/18 03:30, 11^F

→

03/18 03:35, , 12^F

03/18 03:35, 12^F

→

03/18 03:35, , 13^F

03/18 03:35, 13^F

推

03/18 03:38, , 14^F

03/18 03:38, 14^F

→

03/18 03:39, , 15^F

03/18 03:39, 15^F

→

03/18 03:40, , 16^F

03/18 03:40, 16^F

‣ 返回看板[ C_and_CPP ] 程設

‣ 更多 lgen7604 的文章

文章代碼(AID): #1BeI6l4a (C_and_CPP)

討論串 (同標題文章)

完整討論串 (本文為第 2 之 3 篇)：

排序：最新先 | 最舊先 | 留言數

1

2

Re: [問題] 使用CUDA Share memory執行"點乘"比glo …

16年前, 03/18

6

16

Re: [問題] 使用CUDA Share memory執行"點乘"比glo …

16年前, 03/18

3

7

[問題] 使用CUDA Share memory執行"點乘"比glo …

16年前, 03/17

在新視窗開啟完整討論串 (共3篇)

C_and_CPP 近期熱門文章

5

14

Re: [心得] 求質數的C++程式

2月前, 05/07

1

3

[心得] 求質數的C++程式已刪文

2月前, 05/06

1

1

[公告] bl2086 水桶

3月前, 04/28

7

20

[問題] c語言重複定義編譯錯誤

4月前, 03/28

1

12

[心得] 求質數的C++程式

4月前, 03/16

4

9

[心得] 求質數的C/C++程式

4月前, 03/07

6

34

[問題] bool變數一寫多讀需要鎖嗎

5月前, 02/11

13

21

Re: [問題] *p++ = *q++

6月前, 01/29

更多近期熱門文章 >>

PTT數位生活區即時熱門文章

10

28

[購機] 求推薦台灣品牌手機

1小時前, 07/28

10

28

[情報] 華擎曝光 AMD Radeon RX 9050 8GB

[ PC_Shopping ]

2小時前, 07/28

11

23

[情報] 技嘉&微星推出新的B550主機板

[ PC_Shopping ]

2小時前, 07/28

31

76

[情報] 等等黨大澇賽… 越等越貴

[ PC_Shopping ]

2小時前, 07/28

23

57

Re: [新聞] 華碩宣布重返平板市場！全新ASUS Pad亮

3小時前, 07/28

122

272

Re: [閒聊] 傳聞下周N卡漲20% 8月其他零件跟上

[ PC_Shopping ]

4小時前, 07/28

5

20

[新聞] 蘋果釋出 iOS 26.6 更新版本！狂修近 90

5小時前, 07/28

5

5

[賣/台南/皆可] EVGA 3080 XC3 + 850W GA 電供 (

[ HardwareSale ]

6小時前, 07/28

更多即時熱門文章 >>

‣ 返回看板[ C_and_CPP ] 程設

‣ 更多 lgen7604 的文章

文章代碼(AID): #1BeI6l4a (C_and_CPP)