討論串[請益] 請問 CUDA 每個 block 可使用多少 shar …
共 4 篇文章
首頁
上一頁
1
下一頁
尾頁

推噓2(2推 0噓 3→)留言5則,0人參與, 最新作者mself (mself)時間15年前 (2010/06/03 08:47), 編輯資訊
0
0
0
內容預覽:
恕刪~. 我把我瞭解到的說一下,請各位看看對不對. GT200系列 每個 SM 有 16K 個 register 與 16KB shared memory. SM 能同時能保持 8 個 block,總計 1024 個 computing threads. 這四者都是 resource limitat
(還有126個字)

推噓4(4推 0噓 15→)留言19則,0人參與, 最新作者HsiaoCC (Learning To Live)時間15年前 (2010/06/03 01:10), 編輯資訊
0
0
0
內容預覽:
來閒扯一下他背後的運作,就 GT200 系列來說. 每個 SM 在 resource 允許的情況下,最多能同時保持 1,024 個 computing threads. 且每次 SM 最多只允許抓取 8 個 blocks,且不能超過 resource limitation. 每個 block 內會有
(還有561個字)

推噓0(0推 0噓 0→)留言0則,0人參與, 最新作者jk21234 ( 1569 11 /47)時間15年前 (2010/06/03 00:49), 編輯資訊
0
0
0
內容預覽:
所以,SM和Block在"某個時段內,獨佔的1:1執行". 如果你覺得不容易理解,它還蠻接近一顆cpu執行多工的方式.. 切換也應該是context switch.有同樣的缺點就是切換再怎麼頻繁,. 對幾百MHZ的晶片來說,都是巨大的效能損失...... (如果我沒記錯,cuda文件有描述conte

推噓0(0推 0噓 0→)留言0則,0人參與, 最新作者mself (mself)時間15年前 (2010/06/03 00:04), 編輯資訊
0
0
0
內容預覽:
就我瞭解,SM 跟 block 有對應,但好像不是 1 對 1,. 數個 block 會一起在一個 SM 上輪流執行,. 視 register 用量,以及 thread 數上限而定. 假設現在是 8 個 block 在 1 個 SM 上輪流執行. 是不是每個 block 只能有 2 KB share
(還有82個字)
首頁
上一頁
1
下一頁
尾頁