Re: [情報] 7900XTX 的L3快取竟然比7600還慢58%!?

看板PC_Shopping (個人電腦購買)作者 (3d)時間2年前 (2023/06/08 07:53), 2年前編輯推噓12(12034)
留言46則, 17人參與, 2年前最新討論串2/2 (看更多)
※ 引述《luvstarrysky ()》之銘言: : 心得:黏膠水的架構似乎生出了快取延遲的問題,這點在Ryzen CPU靠堆疊3D快取的方式 : 來解決,但AMD為了賺錢是絕對不會在Radeon GPU上複製這種方式的,畢竟現在都 : 只能靠吃NV吃剩的大餅碎屑來充飢,不需要搞得多好也有粉絲買單,財報好看, : AMD笑哈哈,消費者苦哈哈。 這樣的心得真的只是來挑釁的。引述的url也內容空洞。來看最原始的文章吧 先講L3的latency並不是很重要,GPU的設計本來就是吃bandwidth犧牲latency。 L3在chiplet,latency增加並不是大問題,大問題是data從mcd到gcd需要很大的能耗,所以這是Navi31異常耗能的原因之一。L3真的不應該在chiplet上,N/I擴張L2棄L3是有原因的。 https://chipsandcheese.com/2023/06/04/amds-rx-7600-small-rdna-3-appears/ 這篇其實主要是講VOPD(dual issues)的問題,rdna3在wave32本來就不容易dual issues,舊的wave64模式反而容易dual issues,這是compiler的問題。 rx7600還有另一個大問題,因為用6n而不是5n空間不夠,犧牲掉vector registers,這造成dual issues更困難,因為vector registers的不足。 本來rdna的設計就是wave32雖然效能比wave64差但比較容易達到好性能,但現在VOPD的情況下就反過來了。令人感嘆wave32真是白忙一場的設計。 https://i.imgur.com/wsGh4b3.png
可以看到,如果能夠dual issues,rx7600幾乎可以追上rx6900xt。 這篇其實蠻有趣的,如果你想粗淺了解rdna3的架構與問題。 ------------------------------------- 如果你想黑A,找一下geohot最近兩天的言論,真是把AMD黑死了,雖然geohot自己的問題也很大,但他黑之有物 -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 219.70.128.119 (臺灣) ※ 文章網址: https://www.ptt.cc/bbs/PC_Shopping/M.1686182036.A.AC3.html ※ 編輯: oopFoo (219.70.128.119 臺灣), 06/08/2023 07:55:59

06/08 07:58, 2年前 , 1F
rdna3真的是大大大失敗
06/08 07:58, 1F

06/08 08:53, 2年前 , 2F
所以蘇媽該降價了
06/08 08:53, 2F

06/08 09:09, 2年前 , 3F
黑A真的要言之有物 相比前篇心得跟坨一樣
06/08 09:09, 3F

06/08 09:35, 2年前 , 4F
the tiny corp 才沒多久 他又轉向了..XD
06/08 09:35, 4F

06/08 09:56, 2年前 , 5F
他只是想黑,才不管內容怎樣
06/08 09:56, 5F

06/08 10:15, 2年前 , 6F
MCM第一代問題多,等下一代
06/08 10:15, 6F

06/08 10:24, 2年前 , 7F
這篇程度和原PO天差地遠
06/08 10:24, 7F

06/08 11:42, 2年前 , 8F
MCD能耗是都花在傳輸上嗎? 這代都2.5D
06/08 11:42, 8F

06/08 11:43, 2年前 , 9F
了 感覺是L3太大本來就吃電 應該不是
06/08 11:43, 9F

06/08 11:43, 2年前 , 10F
傳輸的問題
06/08 11:43, 10F

06/08 11:46, 2年前 , 11F
AMD架構本來就贏不過NV也是問題 天生就
06/08 11:46, 11F

06/08 11:47, 2年前 , 12F
吃電了 MCM的確還有在傷一點 最後就QQ
06/08 11:47, 12F

06/08 11:49, 2年前 , 13F
架構還好,看了geohot黑的點應該驅動
06/08 11:49, 13F

06/08 11:57, 2年前 , 14F
只不過最近我們也是在嘲諷nv功耗換效能?
06/08 11:57, 14F

06/08 12:33, 2年前 , 15F
L3的頻寬用mcm,耗電量大增,SPR也有同樣
06/08 12:33, 15F

06/08 12:33, 2年前 , 16F
問題。驅動就是硬體的延伸,好硬體好驅動
06/08 12:33, 16F

06/08 12:34, 2年前 , 17F
先推再說,雖然我真的看不懂
06/08 12:34, 17F

06/08 12:37, 2年前 , 18F
傳輸耗能沒那麼多拉 功耗差的量級不是
06/08 12:37, 18F

06/08 12:37, 2年前 , 19F
傳輸的問題
06/08 12:37, 19F

06/08 12:45, 2年前 , 20F
2.5D的傳輸功耗應該是1pJ/bit以內
06/08 12:45, 20F

06/08 12:46, 2年前 , 21F
inifite fanout link峰值頻寬是5.3TB/s
06/08 12:46, 21F

06/08 12:47, 2年前 , 22F
全頻寬吃下去40~50W吧 不過怎麼可能沒事
06/08 12:47, 22F

06/08 12:47, 2年前 , 23F
一直保持那麼大的數據交換 多少有影響但
06/08 12:47, 23F

06/08 12:47, 2年前 , 24F
應該不是主因
06/08 12:47, 24F

06/08 12:52, 2年前 , 25F

06/08 12:52, 2年前 , 26F
這邊提到CoWoS 0.5pJ/bit而已 InFO到底
06/08 12:52, 26F

06/08 12:55, 2年前 , 27F
多少還要查一下
06/08 12:55, 27F

06/08 13:00, 2年前 , 28F
06/08 13:00, 28F

06/08 13:00, 2年前 , 29F
這邊 可能才0.2~0.3pJ/Bit而已 傳輸功耗
06/08 13:00, 29F

06/08 13:00, 2年前 , 30F
有可能才20W不到 問題不該是這個
06/08 13:00, 30F

06/08 13:54, 2年前 , 31F
比較好奇高速io在不傳輸時是不是很省電?XD
06/08 13:54, 31F

06/08 14:24, 2年前 , 32F
spr的問題不在於emib,而是電壓過
06/08 14:24, 32F

06/08 14:24, 2年前 , 33F
高加上全吞吐avx512和amx
06/08 14:24, 33F

06/08 14:25, 2年前 , 34F
CML-S之後的任何一代電壓都是比正
06/08 14:25, 34F

06/08 14:25, 2年前 , 35F
常需求多出0.1v起跳,SPR都快比電
06/08 14:25, 35F

06/08 14:25, 2年前 , 36F
壓表標的多了0.15v了
06/08 14:25, 36F

06/08 16:17, 2年前 , 37F
server就是穩定性和安全性最重要,SPR
06/08 16:17, 37F

06/08 16:17, 2年前 , 38F
已經延遲了一年,為了盡快出貨,電壓
06/08 16:17, 38F

06/08 16:17, 2年前 , 39F
也只能設定的高一些
06/08 16:17, 39F

06/08 16:19, 2年前 , 40F
EMR會改善的
06/08 16:19, 40F

06/08 17:25, 2年前 , 41F
高頻高效能的die2die功耗那有辦法這麼低
06/08 17:25, 41F

06/08 17:26, 2年前 , 42F
只跑低頻什麼低功率都有可能。spr的問題真
06/08 17:26, 42F

06/08 17:27, 2年前 , 43F
在emib。高功耗i皇還可以解決,emib的效率
06/08 17:27, 43F

06/08 17:27, 2年前 , 44F
還需要時間
06/08 17:27, 44F

06/08 19:47, 2年前 , 45F
講太深…
06/08 19:47, 45F

06/10 11:27, 2年前 , 46F
你太認真了,但是有料給推
06/10 11:27, 46F
文章代碼(AID): #1aWHYKh3 (PC_Shopping)
文章代碼(AID): #1aWHYKh3 (PC_Shopping)