[心得] 珍惜生命 遠離 A 卡

看板PC_Shopping (個人電腦購買)作者 (pomelocandy)時間1月前 (2025/01/22 01:04), 1月前編輯推噓-10(4252151)
留言245則, 95人參與, 1月前最新討論串1/2 (看更多)
寫在前頭:標題有點聳動,其實是沒那麼誇張的 這篇也許不適用大部分的 Windows User 主要是針對 Linux 為主的 User,以下列出我的系統配置供參 CPU+GPU: AMD 7950X MB: Gigabyte X670 GAMING X AX V2 BIOS: 有升到 Version: F32f OS: Archlinux Xorg + MateDesktop ==== 前情提要: #1c31Ldfs (PC_Shopping) 大約在去年 4 月初發菜單,應該是 4 月中下單拿到機器 初用沒什麼大問題,7950X 跟本來的 2400G 比起來也快很多 但過去一年有個最頭痛的點,是這顆的 GPU 不穩定 會發病的時間有幾個 1. 是在玩 Minecraft 的時候 2. 是我用 vscode 跑 hugo 寫 blog 的時候 會遇到畫面變成這個樣子: https://imgur.com/a9sZUBH
在 dmesg 內會出現如下的訊息: https://imgur.com/H90iXvm
通常只要出現這個狀況,只有重新開機才能回復正常 另外有找了 Linux 上的燒機軟體,但沒抓到什麼問題 整體就是詭異,vscode + hugo 是會有什麼問題? 但我寫一篇 blog 的時間,就足以讓它當個 3-4 次 當然我今年工作太忙 blog 沒什麼產出,Minecraft 也不是真玩而是測一些設計 所以覺得沒差就將就用 ==== 病情加劇: 轉機大概是發生在去年 10 月左右,因為 factorio space age 出了 但我 legacy 都還沒過,就把它拉出來玩 minecraft 3D 不行那 2D 的遊戲總可以吧,也是真的可以玩 但那時開始注意到,桌面上方狀態列,AMDGPU 的溫度有異常 不是如下圖 sensors 顯示的 600 多度,就是低到可以當冷氣的個位數溫度 https://imgur.com/aePz11k
然後跟朋友連線 factorio 的時候,本來不會有的 GPU reset 開始變頻繁了 如上面的畫面花掉變少了,但 X 會當掉讓圖形介面重開始登入,這個頻率開始上升 甚至 factorio 連線 10 秒左右就當掉 ==== 維修: 過完年之後,把電腦裝箱送去原店面檢修,描述症狀,上電進 BIOS 之後 溫度寫著 17 ℃ ,店員也覺得不太正常 但因為在一年內,直接換了一顆新的 7950X,當天就能拿回家 ==== 新的 U 新的問題: 拿到新的 CPU+GPU 結果有新的問題:這顆甚至比上一顆更不穩 跟之前一樣,螢幕不會花但會有 GPU reset,把 dmesg 的訊息打進 google 會得到一狗票的相關內容,錯誤訊息關鍵字是:amdgpu: GPU reset begin! 災情從 5850U 5700XT 7950X 都有 https://bbs.archlinux.org/viewtopic.php?id=287148 https://bbs.archlinux.org/viewtopic.php?id=266795 我的還會有個討厭的副作用,就是瀏覽器的字體會噴掉,如下圖所示: https://imgur.com/zXSbSPF
對啦我就是在 GO 有多嚴重?大概 ptt 一個頁面會有 1-2 個字噴掉 有些滑鼠反白就會正常,有些不會,不會的也沒辦法 後來呢? 本來我個人是懷疑,AMD driver 或是 mesa 可能寫壞了 畢竟打開 mesa 的 bug report 就是滿滿的 AMD issue (同學提醒 mesa 本來就只會有 AMD issue) https://gitlab.freedesktop.org/mesa/mesa/-/issues 另外這本來就 linux 的錯誤訊息,所以我不知道 windows 那邊有沒有類似災情 但說真的,如果我二連抽 7950X 都抽到爛貨那 AMD 還要不要賣? 本來覺得沒救了,大不了過年後去買張 N 卡 結果在討論區找到一個神奇的 flag,把下面這行加到 grub 的開機設定裡: amdgpu.ppfeaturemask=0xfffd3fff 問題就解了……???雖然字體有時候還是會爆掉 但跟之前沒事就看到各種變大、變小、重疊、加刪除線的字 還有打個 skype 或是開機太快點 firefox 都會觸發 GPU reset 實在有天壤之別 前幾天跟同學連線打 factorio 也沒問題,順順打了 3 hr ==== 後記 上一顆 2400G 可以說給個人留下很好的印象,好用又有 GPU 本來有一張 1050Ti 在換電腦的時候一併換掉了 結果沒想到踩在 7950X 連續遇了幾個問題,只能說 AMD 你加油吧… -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 36.231.74.162 (臺灣) ※ 文章網址: https://www.ptt.cc/bbs/PC_Shopping/M.1737479044.A.9CF.html ※ 編輯: lc85301 (36.231.74.162 臺灣), 01/22/2025 01:05:35

01/22 01:12, 1月前 , 1F
N卡其實也會,bug沒少過..
01/22 01:12, 1F

01/22 01:23, 1月前 , 2F
這也不叫A卡阿老哥
01/22 01:23, 2F

01/22 01:24, 1月前 , 3F
改 ppfeaturemask 喔?那就是電壓太高吧
01/22 01:24, 3F

01/22 01:24, 1月前 , 4F
你這不叫A卡, 因為你不是插上radeon
01/22 01:24, 4F

01/22 01:24, 1月前 , 5F
顯卡用, 你用的是內顯
01/22 01:24, 5F

01/22 01:25, 1月前 , 6F
這哪叫a卡==???
01/22 01:25, 6F

01/22 01:25, 1月前 , 7F
我是 6600XT 從上市用到現在沒遇到問題
01/22 01:25, 7F

01/22 01:26, 1月前 , 8F
所以拿INTEL內顯的也能叫用了i卡了484
01/22 01:26, 8F

01/22 01:26, 1月前 , 9F
除了 DD2/MHWilds 那個跟 shader cache
01/22 01:26, 9F

01/22 01:27, 1月前 , 10F
尊爵不凡的Linux用戶就這0.0?
01/22 01:27, 10F

01/22 01:27, 1月前 , 11F
有關的 bug。
01/22 01:27, 11F

01/22 01:28, 1月前 , 12F
什麼A卡 這叫內顯 還不是APU的內顯勒
01/22 01:28, 12F

01/22 01:29, 1月前 , 13F
珍惜生命遠離水,空氣和陽光
01/22 01:29, 13F

01/22 01:30, 1月前 , 14F
我看你是沒被N卡驅動搞過
01/22 01:30, 14F
目前是還真的沒有 其實 2400G 我也用得很開心,超穩定用了 6 年 就換了 7950X 之後開始出事

01/22 01:33, 1月前 , 15F
然後現在竟然還有人在用 clearlooks 主題
01/22 01:33, 15F

01/22 01:35, 1月前 , 16F
你給的連結第一頁就五條 intel 的 issue
01/22 01:35, 16F

01/22 01:36, 1月前 , 17F
ANV 就是 intel 的 vulkan driver
01/22 01:36, 17F

01/22 01:36, 1月前 , 18F
還特別給你標藍色
01/22 01:36, 18F

01/22 01:38, 1月前 , 19F
去用I卡
01/22 01:38, 19F

01/22 01:38, 1月前 , 20F
Linux上的N卡驅動才是真的搞
01/22 01:38, 20F

01/22 01:38, 1月前 , 21F
AMD至少還是用Mesa
01/22 01:38, 21F

01/22 01:40, 1月前 , 22F
linux用N卡會死得更慘,從開機就黑的
01/22 01:40, 22F

01/22 01:40, 1月前 , 23F
到現在還是沒辦法順順的用Wayland
01/22 01:40, 23F

01/22 01:40, 1月前 , 24F
真的是NVIDIA fxxk you
01/22 01:40, 24F

01/22 01:40, 1月前 , 25F
先做好進單人模式去修的覺悟再上N卡
01/22 01:40, 25F

01/22 01:41, 1月前 , 26F
78x3d+79gre win11 24h2沒問題路過
01/22 01:41, 26F

01/22 01:42, 1月前 , 27F
arch討論區也有討論的話肯定是通病了
01/22 01:42, 27F

01/22 01:43, 1月前 , 28F
N卡要是搞事時就是你要重灌的時候了
01/22 01:43, 28F

01/22 01:43, 1月前 , 29F
你說的A卡 是指AMD在卡你八
01/22 01:43, 29F

01/22 01:45, 1月前 , 30F
0.0a
01/22 01:45, 30F

01/22 01:48, 1月前 , 31F
AMD的CPU 沒掛G的內顯本來就是只給你亮機用
01/22 01:48, 31F

01/22 01:49, 1月前 , 32F
Linux is free if your time is free.
01/22 01:49, 32F

01/22 01:49, 1月前 , 33F
蘇媽本來就預設你要玩遊戲就另外去買顯卡
01/22 01:49, 33F

01/22 01:49, 1月前 , 34F
(還是要給N一下中指)
01/22 01:49, 34F

01/22 01:50, 1月前 , 35F
不過剩下的問題感覺就是跟系統相容有關
01/22 01:50, 35F

01/22 01:50, 1月前 , 36F
這部分也只能說...等他修
01/22 01:50, 36F

01/22 01:54, 1月前 , 37F
Linux的話是也可以自己修啦 但這東西我反正
01/22 01:54, 37F

01/22 01:54, 1月前 , 38F
搞不懂 也沒時間去搞懂 跟著大家一起用WIN
01/22 01:54, 38F
還有 167 則推文
還有 9 段內文
01/23 01:02, 1月前 , 206F
這的確跟哪個 distro 無關,大家都有的
01/23 01:02, 206F

01/23 01:02, 1月前 , 207F
問題啊。
01/23 01:02, 207F

01/23 01:04, 1月前 , 208F
硬體會不會動很直接的就是看 kernel 版本
01/23 01:04, 208F

01/23 01:05, 1月前 , 209F
頂多像 nvidia 那種要另外 build 的
01/23 01:05, 209F

01/23 01:06, 1月前 , 210F
丟給 dkms 去做。顯卡再多個選 mesa 版本
01/23 01:06, 210F

01/23 01:06, 1月前 , 211F
各家 distro 幹的事情都差不多啦
01/23 01:06, 211F

01/23 08:10, 1月前 , 212F
台灣媒體教你的?
01/23 08:10, 212F

01/23 12:08, 1月前 , 213F
照目前推文的走向來看,這篇文比較適合
01/23 12:08, 213F

01/23 12:08, 1月前 , 214F
發在Linux板,但原po只憑兩個7950X內顯
01/23 12:08, 214F

01/23 12:08, 1月前 , 215F
就斷定所有的AM5 7000系CPU內顯都會在
01/23 12:08, 215F

01/23 12:08, 1月前 , 216F
Linux上發生相同的問題,我是覺得過於
01/23 12:08, 216F

01/23 12:08, 1月前 , 217F
武斷也不符統計學的要求啦(但還是要請
01/23 12:08, 217F

01/23 12:08, 1月前 , 218F
專業的統計學大師出來現身說法,我已經
01/23 12:08, 218F

01/23 12:08, 1月前 , 219F
很久沒看到他在此板上出沒了@@),然後
01/23 12:08, 219F

01/23 12:08, 1月前 , 220F
原po有向AMD回報這個問題嗎?如果沒回報
01/23 12:08, 220F

01/23 12:08, 1月前 , 221F
那AMD怎麼會知道有這個bug存在,即使先
01/23 12:08, 221F

01/23 12:08, 1月前 , 222F
前已經有其他人回報了,但我認為還是可
01/23 12:08, 222F

01/23 12:08, 1月前 , 223F
以將你的這類狀況回報上去,並且附上你
01/23 12:08, 223F

01/23 12:08, 1月前 , 224F
後來解決問題的方法讓他們參考會比較好
01/23 12:08, 224F

01/23 12:08, 1月前 , 225F
,既然都希望AMD加油了,那我也希望原
01/23 12:08, 225F

01/23 12:08, 1月前 , 226F
po可以多加把勁,讓這個問題可以盡可能
01/23 12:08, 226F

01/23 12:08, 1月前 , 227F
的改善甚至解決囉~
01/23 12:08, 227F

01/23 12:37, 1月前 , 228F
原 po 貼的東西就社群回報過的結果啊
01/23 12:37, 228F

01/23 12:37, 1月前 , 229F
不然這個 workaround 不會憑空生出來
01/23 12:37, 229F

01/23 12:39, 1月前 , 230F
甚至 gentoo wiki 都明確記載的事情
01/23 12:39, 230F

01/23 12:50, 1月前 , 231F
"amdgpu.ppfeaturemask=0xfffd3fff "
01/23 12:50, 231F

01/23 12:50, 1月前 , 232F
那這個原po自己試過的程式碼,不知道有
01/23 12:50, 232F

01/23 12:50, 1月前 , 233F
沒有人已經回報給AMD?因為我看到的是原
01/23 12:50, 233F

01/23 12:50, 1月前 , 234F
po敘述在討論區上看到的flag
01/23 12:50, 234F

01/23 12:51, 1月前 , 235F
但...好像沒看到有人回報?
01/23 12:51, 235F

01/23 12:52, 1月前 , 236F
如果有回報給AMD那就好,就看AMD之後的
01/23 12:52, 236F

01/23 12:53, 1月前 , 237F
反應了,既然這個問題已經影響到多數人
01/23 12:53, 237F

01/23 12:53, 1月前 , 238F
我覺得使用者與AMD之間的溝通是滿重要
01/23 12:53, 238F

01/23 12:53, 1月前 , 239F
的就是
01/23 12:53, 239F

01/23 20:23, 1月前 , 240F
那個 mesa RADV 算社群跟 AMD 共同維護
01/23 20:23, 240F

01/23 20:23, 1月前 , 241F
AMD 自己還有一個 amdvlk driver
01/23 20:23, 241F

01/23 20:24, 1月前 , 242F
也是開源的。不管哪邊都有 AMD 的人
01/23 20:24, 242F

01/23 20:26, 1月前 , 243F
除了 AMD/Intel 以外 Red hat 跟 Valve
01/23 20:26, 243F

01/23 20:26, 1月前 , 244F
也出了很多力
01/23 20:26, 244F

01/23 21:25, 1月前 , 245F
了解,謝謝解說
01/23 21:25, 245F
文章代碼(AID): #1dZzE4dF (PC_Shopping)
文章代碼(AID): #1dZzE4dF (PC_Shopping)