討論串[請益] 請問 CUDA 每個 block 可使用多少 shar …
共 4 篇文章
首頁
上一頁
1
下一頁
尾頁
內容預覽:
恕刪~. 我把我瞭解到的說一下,請各位看看對不對. GT200系列 每個 SM 有 16K 個 register 與 16KB shared memory. SM 能同時能保持 8 個 block,總計 1024 個 computing threads. 這四者都是 resource limitat
(還有126個字)
內容預覽:
來閒扯一下他背後的運作,就 GT200 系列來說. 每個 SM 在 resource 允許的情況下,最多能同時保持 1,024 個 computing threads. 且每次 SM 最多只允許抓取 8 個 blocks,且不能超過 resource limitation. 每個 block 內會有
(還有561個字)
內容預覽:
就我瞭解,SM 跟 block 有對應,但好像不是 1 對 1,. 數個 block 會一起在一個 SM 上輪流執行,. 視 register 用量,以及 thread 數上限而定. 假設現在是 8 個 block 在 1 個 SM 上輪流執行. 是不是每個 block 只能有 2 KB share
(還有82個字)
首頁
上一頁
1
下一頁
尾頁