Re: [情報] GMP 建議不要用 Zen5

看板PC_Shopping (個人電腦購買)作者 (Zany)時間2周前 (2025/08/28 09:34), 2周前編輯推噓73(741424)
留言499則, 50人參與, 2周前最新討論串2/2 (看更多)
https://gmplib.org/gmp-zen5 連結內有一些CPU的圖跟兩台的配備 全部貼來PTT好像有點長,我截下面比較重要的部分+AI翻 We really don’t know what is wrong here. Let us list some observations and thoughts: The ambient temperature was in both cases quite low. These are supposedly top-quality motherboard (We’ve had about 50 ASUS motherboard over the years, and only had one failure). The offset mounting does not look right to us. But this is how things are supposed to be done. It is possible that we caused the 2nd CPU failure by inadequate mounting of the heat sink. It surely seems bizarre to have the thermal paste squeezed like shown on the pictures above! But note that the 1st failure happened with a more centred heat sink. We only made the off-centre mounting for the 2nd system as to minimise the risk of a repeated system failure. The so-called TDP of the Ryzen 9950X is 170W. The used heat sinks are specified to dissipate 165W, so that seems tight. We have extra fans in the cases and a low ambient temperature, making these 5W seem negligible. But of course, this is not completely kosher. We have a sister system for the 9950X, a 7950X which is similarly configured and built. That system actually seems to run slightly hotter, but it has been stable for a long time (under the same crazy load!). The systems were under maximal load at the time their CPUs died, running very tight handcrafted asm loops sustaining one MULX per cycle. That might be a “ hot” instruction. Did the CPUs die of heat stroke? Modern CPUs measure their temperature and clock down if they get too hot, don’t they? We don’t overclock or overvolt or play other teen games with our hardware. The extremely thin layer of thermal paste which resulted from the off-centre heat sink mount, might seem fine. We however suspect that there might be a problem, as when the system heats and cools, things bend a little. With a remaining layer of thermal paste, such bending will not create any void as the paste’s elasticity will maintain some contact. When the thermal paste is squeezed away as with the suggested Noctua mounting, an ever-so-slight void between the CPU and the heat sink might be created. Neither of the 9950X CPUs died immediately, instead they died the exact same way after a couple of months at high load. This seems to suggest a gradual but predictable degradation. 我們真的不清楚問題出在哪裡。以下是一些我們的觀察與想法: 兩次故障發生時,環境溫度都相當低。 我們使用的是公認品質頂尖的主機板 (多年來我們用過約 50 張 ASUS 主機板,只壞過一張)。 偏置安裝看起來很奇怪,但這卻是官方建議的安裝方式。 第二次 CPU 故障有可能是我們安裝散熱器不當所致。散熱膏被擠壓成上圖那樣,確實有 點匪夷所思。 但值得注意的是,第一次故障時散熱器是置中安裝的。我們在第二套系統上改用偏置安裝 ,正是為了避免重蹈覆轍。 Ryzen 9950X 的所謂熱設計功耗(TDP)是 170W,而我們使用的散熱器解熱能力規格為 165W,規格上確實有點吃緊。不過考量到我們在機殼內加裝了風扇,且環境溫度低,這 5W 的差距應該可以忽略。但嚴格來說,這確實不是最標準的作法。 我們有一套與 9950X 系統配置相近的 7950X 系統。那套系統的運作溫度似乎還稍微高一 些,但在同樣極端的負載下,它已經穩定運行了很長時間。 CPU 燒毀的當下,系統都處於滿載狀態,持續運行著我們手動編寫、極度精簡的 asm 迴 圈,每個時脈週期執行一次 MULX 指令。這或許是個發熱量極大的指令。 CPU 是因為過熱燒毀的嗎?現代 CPU 不是都有溫度監控,會在過熱時自動降頻保護嗎? 我們從不對硬體進行超頻、加壓或任何類似的胡亂設定。 偏置安裝導致散熱膏層極薄,表面上可能沒問題。但我們懷疑,當系統反覆升溫和降溫時 ,金屬會產生微小的形變。如果還有一層散熱膏,膏體的彈性可以填補縫隙,維持接觸。 但若像 Noctua 建議的安裝方式那樣將散熱膏完全擠開,CPU 和散熱器之間就可能因形變 產生一道極其微小的空隙。 兩顆 9950X CPU 都不是立即損壞,而是在高強度負載幾個月後,以完全相同的方式故障 。這似乎指向一種緩慢但可預測的漸進式損耗。 關於文中提到的off-centre mounting We use a Noctua cooling solution for both systems. For the 1st system, we mounted the heat sink centred. For the 2nd system, we followed Noctua’s advice of mounting things offset towards what they claim to be the hotter side of the CPU. Below is a picture of the 2nd system without the heat sink which shows that offset. Note the brackets and their pins, those pins are where the heat sink’s pressure gets centred. Also note how the thermal paste has been squeezed away from that part, but is quite thick towards the left. 我們的兩套系統都採用 Noctua 散熱器。第一套系統,我們將散熱器置中安裝。到了第二 套系統,我們則遵循 Noctua 的建議,將散熱器偏向他們所謂 CPU 較熱的一側進行安裝 。下方是第二套系統未安裝散熱器的照片,可以清楚看到偏置安裝的狀況。請注意支架和 卡榫,散熱器的壓力就集中在這些卡榫上。同時也請注意,散熱膏如何從壓力集中處被完 全擠開,但在左側卻保留了相當的厚度。 ---- 因為天氣夠冷所以散熱用稍微不夠是可以的嗎?尤其是在大量數學計算上? 積熱應該還是會積在裡面吧?熱交換不夠快外面再涼也沒意義? (編輯) 補充:看推文討論溫度可能不是主要原因 -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 1.160.16.3 (臺灣) ※ 文章網址: https://www.ptt.cc/bbs/PC_Shopping/M.1756344840.A.5CD.html ※ 編輯: zseineo (1.160.16.3 臺灣), 08/28/2025 09:39:47

08/28 09:42, 2周前 , 1F
就像冰島蓋資料中心,再冷也不可能放
08/28 09:42, 1F

08/28 09:42, 2周前 , 2F
露天自然對流散熱XD
08/28 09:42, 2F

08/28 09:45, 2周前 , 3F
長期用解熱能力不到TDP的散熱器
08/28 09:45, 3F

08/28 09:46, 2周前 , 4F
燒毀不是理所當然的嗎……?
08/28 09:46, 4F

08/28 09:47, 2周前 , 5F
哪裡來的自信?
08/28 09:47, 5F

08/28 09:47, 2周前 , 6F
換解熱能力更好不就好?
08/28 09:47, 6F

08/28 09:47, 2周前 , 7F
170W你拿165W來解 然後叫大家不要用
08/28 09:47, 7F

08/28 09:47, 2周前 , 8F
ZEN5
08/28 09:47, 8F

08/28 09:48, 2周前 , 9F
你哪來的自信建議人家
08/28 09:48, 9F

08/28 09:48, 2周前 , 10F
瑞典的天氣給他們的吧 XDD
08/28 09:48, 10F

08/28 09:50, 2周前 , 11F
阿 不是這樣看得吧 XD
08/28 09:50, 11F

08/28 09:50, 2周前 , 12F
要靠散熱器把熱量導出去啊
08/28 09:50, 12F

08/28 09:51, 2周前 , 13F
用165W 正常來說就降頻而已啊 哪有怎樣
08/28 09:51, 13F

08/28 09:52, 2周前 , 14F
連跳停都沒有你要怎麼跟我說散熱不足
08/28 09:52, 14F

08/28 09:53, 2周前 , 15F
165去嘴太好笑了八 這樣ITX一堆狀況更差
08/28 09:53, 15F

08/28 09:53, 2周前 , 16F
的不是死不玩了
08/28 09:53, 16F

08/28 09:55, 2周前 , 17F
使用頻率不同,不然ITX跑Prime95整個
08/28 09:55, 17F

08/28 09:55, 2周前 , 18F
月看看
08/28 09:55, 18F

08/28 09:57, 2周前 , 19F
想要24/7高壓的就別偷散熱 很難嗎
08/28 09:57, 19F

08/28 09:57, 2周前 , 20F
靠,這完全是使用者的錯
08/28 09:57, 20F

08/28 09:58, 2周前 , 21F
散熱都嫌不夠了,還想靠自然環境補救
08/28 09:58, 21F

08/28 09:58, 2周前 , 22F
,呵呵
08/28 09:58, 22F

08/28 10:02, 2周前 , 23F
他就高壓使用阿
08/28 10:02, 23F

08/28 10:02, 2周前 , 24F
friedpig你CPU 24/7 都滿載嗎
08/28 10:02, 24F

08/28 10:02, 2周前 , 25F
官方就寫170W 硬要拿165W
08/28 10:02, 25F

08/28 10:03, 2周前 , 26F
搞事情,然後叫大家不要買 很會喔
08/28 10:03, 26F

08/28 10:03, 2周前 , 27F
不是欠罵是怎樣
08/28 10:03, 27F

08/28 10:03, 2周前 , 28F
這是中國人在瑞典是不是
08/28 10:03, 28F

08/28 10:06, 2周前 , 29F
TDP差5 環境溫度還低於20度 從頭到尾也
08/28 10:06, 29F

08/28 10:06, 2周前 , 30F
真的提到CPU實際溫度 只說比7950X低而已
08/28 10:06, 30F

08/28 10:06, 2周前 , 31F
你是聽不懂規格上面寫170W嗎
08/28 10:06, 31F

08/28 10:06, 2周前 , 32F
上法院跟法官說看看
08/28 10:06, 32F

08/28 10:07, 2周前 , 33F
AMD吃飽撐著在規格上面標170W幹嘛
08/28 10:07, 33F

08/28 10:07, 2周前 , 34F
還是說170W其實165W也要沒問題
08/28 10:07, 34F

08/28 10:07, 2周前 , 35F
法官判決AMD要回收全部產品
08/28 10:07, 35F

08/28 10:07, 2周前 , 36F
TDP這東西不都是虛標的?如果都開Auto,正
08/28 10:07, 36F

08/28 10:07, 2周前 , 37F
常撞功耗牆不是自己會降壓?
08/28 10:07, 37F

08/28 10:08, 2周前 , 38F
這樣要去只關注這個點是有點好笑
08/28 10:08, 38F

08/28 10:08, 2周前 , 39F
你去跟法官說看看
08/28 10:08, 39F
還有 420 則推文
還有 1 段內文
08/29 05:56, 2周前 , 460F
最低處理器狀態還要調80%才能穩定
08/29 05:56, 460F

08/29 05:56, 2周前 , 461F
不當機了
08/29 05:56, 461F

08/29 05:58, 2周前 , 462F
縮都縮在空載輕載的最低vcore那邊,
08/29 05:58, 462F

08/29 05:58, 2周前 , 463F
筆電沒辦法鎖vcore所以只能調高處
08/29 05:58, 463F

08/29 05:58, 2周前 , 464F
理器最低狀態讓vcore不要掉到0.7v
08/29 05:58, 464F

08/29 05:58, 2周前 , 465F
以下
08/29 05:58, 465F

08/29 05:59, 2周前 , 466F
不然掛機放著不動沒多久就會藍屏死
08/29 05:59, 466F

08/29 05:59, 2周前 , 467F
08/29 05:59, 467F

08/29 07:49, 2周前 , 468F
165W~92度7950X FFT 1年半沒當過
08/29 07:49, 468F

08/29 09:52, 2周前 , 469F
本來想說AMD的溫度控制沒這麼爛,但想
08/29 09:52, 469F

08/29 09:53, 2周前 , 470F
想之前測AI MAX+ 395時的熱當好像就是
08/29 09:53, 470F

08/29 09:54, 2周前 , 471F
跑到死都沒觸發降頻保護才發生的
08/29 09:54, 471F

08/29 09:55, 2周前 , 472F
"指向一種緩慢但可預測的漸進式損耗"
08/29 09:55, 472F

08/29 09:55, 2周前 , 473F
其實幾乎可以判斷就是這個原因,只是他沒
08/29 09:55, 473F

08/29 09:56, 2周前 , 474F
全程監控所以沒有證據不能用肯定句
08/29 09:56, 474F

08/29 09:58, 2周前 , 475F
這幾年三大廠主板BIOS處理CPU都習慣先加壓
08/29 09:58, 475F

08/29 09:59, 2周前 , 476F
這樣長期損耗就會發生在高頻率,然而PBO這
08/29 09:59, 476F

08/29 10:00, 2周前 , 477F
流行後很多人只會抄小參降壓,是在跟BIOS
08/29 10:00, 477F

08/29 10:00, 2周前 , 478F
對著幹而不自知,各種奇怪的縮缸也就出現
08/29 10:00, 478F

08/29 10:14, 2周前 , 479F
兩台樣本太少了啦 兩台就做總結歸納有
08/29 10:14, 479F

08/29 10:14, 2周前 , 480F
點太快 他多死幾台比較有說服力
08/29 10:14, 480F

08/29 10:21, 2周前 , 481F
電死
08/29 10:21, 481F

08/29 12:53, 2周前 , 482F
今年reddit/fb一推zen5燒掉,主要是asrock
08/29 12:53, 482F

08/29 12:55, 2周前 , 483F
沒錯。本來我覺得是爾發事件,但gmplib這
08/29 12:55, 483F

08/29 12:58, 2周前 , 484F
件,我覺得可能真的有其它原因。mulx是整
08/29 12:58, 484F

08/29 12:59, 2周前 , 485F
數(integer)指令,跟浮點指令比起來,應
08/29 12:59, 485F

08/29 13:00, 2周前 , 486F
該負載低很多才是,gmp看起來也不用simd
08/29 13:00, 486F

08/29 13:01, 2周前 , 487F
指令。所以到底是怎麼燒的,就很奇異。
08/29 13:01, 487F

08/29 13:08, 2周前 , 488F
當然也有可能程式寫的很好,可以真的8 ipc
08/29 13:08, 488F

08/29 13:10, 2周前 , 489F
所以負載極高?這真的是一團迷
08/29 13:10, 489F

08/29 13:13, 2周前 , 490F
不過剛看一下,Zen5有6 alu,3 multiplier
08/29 13:13, 490F

08/29 13:17, 2周前 , 491F
所以最多3 ipc。這樣應該還好啊
08/29 13:17, 491F

08/29 13:19, 2周前 , 492F
忘了還有load/store,int add。8 ipc不是
08/29 13:19, 492F

08/29 13:20, 2周前 , 493F
不可能。
08/29 13:20, 493F

08/29 13:42, 2周前 , 494F
先不說9000系的電壓問題 AM4用了3代
08/29 13:42, 494F

08/29 13:42, 2周前 , 495F
確實感覺板廠預設電壓都給有點高
08/29 13:42, 495F

08/29 14:50, 2周前 , 496F
怎麼不回應自己那篇?
08/29 14:50, 496F

08/29 18:35, 2周前 , 497F
沒關係 真的沒人在乎你怎麼看
08/29 18:35, 497F

08/30 07:42, 2周前 , 498F

08/30 08:25, 2周前 , 499F
A人緣真好
08/30 08:25, 499F
文章代碼(AID): #1ehx88ND (PC_Shopping)
文章代碼(AID): #1ehx88ND (PC_Shopping)