[問題] CUDA 不同Block間的同步問題

看板C_and_CPP (C/C++)作者 (star8ksn)時間15年前 (2011/04/18 21:34), 編輯推噓2(205)
留言7則, 5人參與, 最新討論串1/1
因為平行度的關西 所以必須同時用到多個Block(跑同一個kernel function) 但因為跑的資料的相依性又很高 所以想請問有沒有什辦法可以做到不同Block間的同步? -- ※ 發信站: 批踢踢實業坊(ptt.cc) ◆ From: 140.113.13.135

04/18 22:53, , 1F
可以參考這篇paper "Inter-Block GPU Communication via
04/18 22:53, 1F

04/18 22:54, , 2F
Fast Barrier Synchronization"
04/18 22:54, 2F

04/18 23:30, , 3F
樓上這篇好物,當初在苦惱這個問題時,看到這篇如同撿到寶
04/18 23:30, 3F

04/19 15:13, , 4F
相依性太高 這樣用GPU跑會比較快嗎? 光sync就好久了
04/19 15:13, 4F

04/19 16:50, , 5F
會!! 而且快蠻多的@@"
04/19 16:50, 5F

04/19 21:39, , 6F
感謝L大的明燈!! 這篇真的是寶啊!!
04/19 21:39, 6F

04/21 21:49, , 7F
L大的那篇,他第三種lock free 為什麼不會變成dead lock?
04/21 21:49, 7F
文章代碼(AID): #1Dh3teLn (C_and_CPP)
文章代碼(AID): #1Dh3teLn (C_and_CPP)