PTT數位生活區 / VideoCard (顯卡板)

Re: [請益] 請問 CUDA 每個 block 可使用多少 shar …

看板VideoCard (顯卡板)作者mself (mself)時間15年前 (2010/06/03 08:47)推噓2(2推 0噓 3→)

留言5則, 2人參與討論串4/4 (看更多)

※ 引述《HsiaoCC (Learning To Live)》之銘言： : ※ 引述《jk21234 ( 1569 11 /47)》之銘言： : : 所以,SM和Block在"某個時段內,獨佔的1:1執行" : : 如果你覺得不容易理解,它還蠻接近一顆cpu執行多工的方式. : : 切換也應該是context switch.有同樣的缺點就是切換再怎麼頻繁, : : 對幾百MHZ的晶片來說,都是巨大的效能損失..... : : (如果我沒記錯,cuda文件有描述context switch部分...) : : 所以也不用擔心你在程式中使用不到16KB的shared memory. : 來閒扯一下他背後的運作，就 GT200 系列來說 : 每個 SM 在 resource 允許的情況下，最多能同時保持 1,024 個 computing threads : 且每次 SM 最多只允許抓取 8 個 blocks，且不能超過 resource limitation 恕刪～ : 回到正題，shared memory 如果需求的量超過，是沒辦法被執行的，只能等到在 SM 中 : 的工作都做完，resource release 了才行~~~ 我把我瞭解到的說一下，請各位看看對不對 GT200系列每個 SM 有 16K 個 register 與 16KB shared memory SM 能同時能保持 8 個 block，總計 1024 個 computing threads 這四者都是 resource limitation 假如今天我寫一個 kernel 用了 16KB shared memory 總共產生有 1024 block，每個 block 128 thread 那麼 SM 就只能抓取 1 個 block 來執行 (因為 shared memory 到達上限) (雖然 thread 總數...等還沒有到達上限) 而這個 CUDA 程式很可能使 SM 有很多 stall 因為 128 thread 可能不足以 hide latency -- ※ 發信站: 批踢踢實業坊(ptt.cc) ◆ From: 203.73.54.16

推

06/03 10:11, , 1^F

06/03 10:11, 1^F

→

06/03 10:13, , 2^F

06/03 10:13, 2^F

→

06/03 10:15, , 3^F

06/03 10:15, 3^F

→

06/03 10:17, , 4^F

06/03 10:17, 4^F

推

06/05 12:42, , 5^F

06/05 12:42, 5^F

‣ 返回看板[ VideoCard ] 硬體

‣ 更多 mself 的文章

文章代碼(AID): #1C1lk9rv (VideoCard)

討論串 (同標題文章)

本文引述了以下文章的的內容：

4

19

Re: [請益] 請問 CUDA 每個 block 可使用多少 shar …

15年前, 06/03

完整討論串 (本文為第 4 之 4 篇)：

排序：最新先 | 最舊先 | 留言數

2

5

Re: [請益] 請問 CUDA 每個 block 可使用多少 shar …

15年前, 06/03

4

19

Re: [請益] 請問 CUDA 每個 block 可使用多少 shar …

15年前, 06/03

Re: [請益] 請問 CUDA 每個 block 可使用多少 shar …

15年前, 06/03

Re: [請益] 請問 CUDA 每個 block 可使用多少 shar …

15年前, 06/03

在新視窗開啟完整討論串 (共4篇)

VideoCard 近期熱門文章

4

7

[送修] 華碩3060ti ko風扇故障

2周前, 11/11

3

8

[閒聊] 顯示卡卡榫斷裂造成整張顯示卡報廢

2周前, 11/11

5

47

[請益] 舊電腦顯示卡升級請益

3周前, 11/03

3

7

[請益] 玩遊戲跟看實況時電腦的使用率有一樣嗎

1月前, 10/23

5

25

[請益] 顯卡維修請教 (ROG 3080)

1月前, 10/15

2

4

[請益] 雙螢幕I卡的一點小問題

1月前, 09/30

1

6

[請益] 請問FSR縮放後的多邊形邊緣線條感覺

2月前, 09/19

3

5

[請益] 特地降幀數再開小黃鴨會比較好嗎?

2月前, 09/12

更多近期熱門文章 >>

PTT數位生活區即時熱門文章

11

23

[問題] iPhone 17回上一頁怎麼做？左邊看似可以

5小時前, 11/27

48

81

Fw: [抱怨] 驊哥電腦雙11特價商品不出貨置底

[ PC_Shopping ]

7小時前, 11/26

2

10

[情報] POCO F8不會有標準版機型

7小時前, 11/26

4

10

Re: [請益] 電腦桌訂製

[ PC_Shopping ]

8小時前, 11/26

8

41

Re: [閒聊] A卡偷畫質？(COD22實測影片)

[ PC_Shopping ]

9小時前, 11/26

7

11

[閒聊] 中國電腦預裝的微軟系統和Office

[ PC_Shopping ]

9小時前, 11/26

9

39

[請益] 遊戲用電腦顯卡升級請益

[ PC_Shopping ]

9小時前, 11/26

9

28

[心得] 金士頓/創見/PNY SSD 送修心得

[ PC_Shopping ]

9小時前, 11/26

更多即時熱門文章 >>

‣ 返回看板[ VideoCard ] 硬體

‣ 更多 mself 的文章

文章代碼(AID): #1C1lk9rv (VideoCard)