PTT數位生活區 / C_and_CPP (C/C++)

[問題] CUDA shared-memory

看板C_and_CPP (C/C++)作者hardman1110 (笨小孩)時間8年前 (2017/10/03 10:12)推噓1(1推 0噓 29→)

留言30則, 3人參與討論串1/1

開發平台(Platform): (Ex: Win10, Linux, ...) WIN10 編譯器(Ex: GCC, clang, VC++...)+目標環境(跟開發平台不同的話需列出) VC2017 額外使用到的函數庫(Library Used): (Ex: OpenGL, ...) CUDA 9.0 問題(Question)：想透過 shared memory 來加速kernal的效能利用treadid 平行assign資料也有用__syncthreads 來同步但資料還是跟用迴圈跑的不一樣 (結果有錯) 想請問大大們我的使用方式有錯嗎? 還有vc上可以單步執行來看CUDA變數嗎? 餵入的資料(Input)：一維陣列的輸入與輸出指標預期的正確結果(Expected Output)： USE_SHARED_MEM = 0 與 = 1 data值要一樣錯誤結果(Wrong Output)： github: https://github.com/ChiFang/question/blob/master/CUDA_SharedMem.cu USE_SHARED_MEM = 1 會導致最後結果錯誤，表示data值不一樣 (後面程式完全一模一樣) 程式碼(Code)：(請善用置底文網頁, 記得排版) #define USE_SHARED_MEM 1 __global__ void kernal_test(const int a_RangeUpScale, const int *a_CostData, int *a_Input) { // Get the work index of the current element to be processed int y = blockIdx.x*blockDim.x + threadIdx.x; //執行緒在陣列中對應的位置 #if USE_SHARED_MEM == 1 __shared__ int Buff[32]; #else int Buff[32]; #endif // Do the operation for (int x = 1; (x < g_ImgWidth_CUDA); x++) { int TmpPos = y*Area + (x-1)*a_RangeUpScale; #if USE_SHARED_MEM == 1 // Synchronize to make sure the sub-matrices are loaded before starting the computation __syncthreads(); if (threadIdx.x < 32) { Buff[threadIdx.x] = a_CostSmooth[TmpPos + threadIdx.x]; } // Synchronize to make sure the sub-matrices are loaded before starting the computation __syncthreads(); #else for (int cnt = 0; cnt < 32 ;cnt++) { Buff[cnt] = a_CostSmooth[TmpPos + cnt]; } #endif // use Buff to do something } } 補充說明(Supplement)： grid size = 8 block size = 135 所以thread id 一定會大於32 -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 114.34.230.27 ※ 文章網址: https://www.ptt.cc/bbs/C_and_CPP/M.1506996728.A.C64.html

→

10/03 10:30, 8年前 , 1^F

10/03 10:30, 1^F

→

10/03 10:40, 8年前 , 2^F

10/03 10:40, 2^F

→

10/03 10:44, 8年前 , 3^F

10/03 10:44, 3^F

→

10/03 11:27, 8年前 , 4^F

10/03 11:27, 4^F

→

10/03 11:28, 8年前 , 5^F

10/03 11:28, 5^F

→

10/03 11:32, 8年前 , 6^F

10/03 11:32, 6^F

推

10/03 12:16, 8年前 , 7^F

10/03 12:16, 7^F

→

10/03 12:16, 8年前 , 8^F

10/03 12:16, 8^F

→

10/03 12:37, 8年前 , 9^F

10/03 12:37, 9^F

→

10/03 13:00, 8年前 , 10^F

10/03 13:00, 10^F

※ 編輯: hardman1110 (114.34.230.27), 10/03/2017 13:24:40

→

10/03 13:26, 8年前 , 11^F

10/03 13:26, 11^F

※ 編輯: hardman1110 (114.34.230.27), 10/03/2017 13:31:48

→

10/03 14:00, 8年前 , 12^F

10/03 14:00, 12^F

→

10/03 14:01, 8年前 , 13^F

10/03 14:01, 13^F

→

10/03 14:09, 8年前 , 14^F

10/03 14:09, 14^F

→

10/03 14:19, 8年前 , 15^F

10/03 14:19, 15^F

→

10/03 14:19, 8年前 , 16^F

10/03 14:19, 16^F

→

10/03 14:20, 8年前 , 17^F

10/03 14:20, 17^F

※ 編輯: hardman1110 (114.34.230.27), 10/03/2017 14:21:21

→

10/03 14:22, 8年前 , 18^F

10/03 14:22, 18^F

→

10/03 14:23, 8年前 , 19^F

10/03 14:23, 19^F

→

10/03 14:24, 8年前 , 20^F

10/03 14:24, 20^F

→

10/03 14:25, 8年前 , 21^F

10/03 14:25, 21^F

→

10/03 14:27, 8年前 , 22^F

10/03 14:27, 22^F

→

10/03 14:27, 8年前 , 23^F

10/03 14:27, 23^F

→

10/03 14:28, 8年前 , 24^F

10/03 14:28, 24^F

→

10/03 14:30, 8年前 , 25^F

10/03 14:30, 25^F

→

10/03 14:31, 8年前 , 26^F

10/03 14:31, 26^F

→

10/03 14:32, 8年前 , 27^F

10/03 14:32, 27^F

→

10/03 14:36, 8年前 , 28^F

10/03 14:36, 28^F

→

10/03 14:55, 8年前 , 29^F

10/03 14:55, 29^F

→

10/03 14:56, 8年前 , 30^F

10/03 14:56, 30^F

‣ 返回看板[ C_and_CPP ] 程設

‣ 更多 hardman1110 的文章

文章代碼(AID): #1Pql7una (C_and_CPP)

C_and_CPP 近期熱門文章

1

4

Re: [心得] 求質數的C++程式

1天前, 05/07

1

3

[心得] 求質數的C++程式已刪文

2天前, 05/06

1

1

[公告] bl2086 水桶

1周前, 04/28

7

20

[問題] c語言重複定義編譯錯誤

1月前, 03/28

1

12

[心得] 求質數的C++程式

1月前, 03/16

4

9

[心得] 求質數的C/C++程式

2月前, 03/07

6

34

[問題] bool變數一寫多讀需要鎖嗎

2月前, 02/11

13

21

Re: [問題] *p++ = *q++

3月前, 01/29

更多近期熱門文章 >>

PTT數位生活區即時熱門文章

-2

9

[請益] 網購品牌機80K預算

[ PC_Shopping ]

6小時前, 05/08

-7

18

[問題] 小白點輔助該放在螢幕哪一位位置比較好?

8小時前, 05/08

13

21

[問題] Ricoh Gr4 monochrome值得嗎

8小時前, 05/08

0

6

[請益] 台灣最屌最專業外送茶 TG ：you5799已刪文

[ PC_Shopping ]

9小時前, 05/08

3

13

[問題] 請問月租最便宜的電信資費

10小時前, 05/08

11

36

[請益] NAS快取用的SSD選擇請益

[ Storage_Zone ]

12小時前, 05/08

31

68

[情報] SONY Xperia 5/13，2026新品發表

12小時前, 05/08

8

13

[iAPP] weat更新自訂天氣預報+支援手錶的氣象署

12小時前, 05/08

更多即時熱門文章 >>

‣ 返回看板[ C_and_CPP ] 程設

‣ 更多 hardman1110 的文章

文章代碼(AID): #1Pql7una (C_and_CPP)