討論串[問題] CUDA 程式
共 2 篇文章
首頁
上一頁
1
下一頁
尾頁
內容預覽:
不知道有沒有高手可以解答以下問題?. 資料形式: 600列800行的隨機數. 目的: 把每一行的數據加起來. 初始化:. sum[600]={0.0}. data[600x800]= 上述資料. CUDA程式1: 成功. // dim3 gridsize(1, 1, 1);. // dim3 blo
(還有422個字)
內容預覽:
這邊有一個簡單的最佳化,先把 tdx thread 負責的 row 之和放在 register. 裡面,這樣可以減少一些不必要的 global memory write。2 的話,每個 block 的 tdx thread 都會往 sum[tdx] 做加總,而 blocks 並沒有保證. 結束的時間
(還有2872個字)
首頁
上一頁
1
下一頁
尾頁