[問題] cuda race condition
小弟目前在練習 cuda 程式
發現在多 thread 同時進行寫入下會有 race condition 問題
ex : 計算整個 array 裡面某個值的數量
變的要用另一個相同大小 array 去判斷
這樣下來反而速度是拖慢的
請問有較快的解決方法嗎?
說明一下我程式 :
這個 array 是 1000 x 1000 大小
所以我開了 1000 x 1000 threads 下去判斷
if (idx < 1000 x 1000 && array[idx] == 1)
sum++;
就發生~ race condition 問題了~ 一次跑完1000x1000筆判斷
thread 會搶寫入空間 , 導致sum錯誤
--
※ 發信站: 批踢踢實業坊(ptt.cc)
◆ From: 140.123.106.104
推
04/21 16:37, , 1F
04/21 16:37, 1F
※ 編輯: evilned 來自: 140.123.106.104 (04/21 17:19)
※ 編輯: evilned 來自: 140.123.106.104 (04/21 17:19)
推
04/21 17:54, , 2F
04/21 17:54, 2F
→
04/21 17:56, , 3F
04/21 17:56, 3F
推
04/21 21:08, , 4F
04/21 21:08, 4F
→
04/21 21:11, , 5F
04/21 21:11, 5F
推
04/21 21:33, , 6F
04/21 21:33, 6F
→
04/21 22:03, , 7F
04/21 22:03, 7F
→
04/21 22:09, , 8F
04/21 22:09, 8F
→
04/21 22:10, , 9F
04/21 22:10, 9F
推
04/21 22:46, , 10F
04/21 22:46, 10F
推
05/23 05:00, , 11F
05/23 05:00, 11F
→
05/23 05:02, , 12F
05/23 05:02, 12F
→
05/23 05:04, , 13F
05/23 05:04, 13F
討論串 (同標題文章)
以下文章回應了本文:
完整討論串 (本文為第 1 之 2 篇):
C_and_CPP 近期熱門文章
PTT數位生活區 即時熱門文章