[情報] 如果 AMD 也支援 AVX-512 指令集會發生

看板PC_Shopping (個人電腦購買)作者 (空白也好)時間3月前 (), 編輯推噓15(17235)
留言54則, 22人參與, 3月前最新討論串1/2 (看更多)
原文標題:如果 AMD 也支援 AVX-512 指令集會發生什麼事? 情報來源:TechNews 原文網址:https://technews.tw/2021/04/07/amd-avx-512/ 最近有國外媒體報導某 Twitter 爆料大神,透露 AMD 下世代 Zen 4 核心,將支援 AVX-512 指令集和人工智慧深度學習常用的 bfloat16 浮點格式(接著是 EPYC 核心數會從 64 激增到 96 個),或多或少也間接印證了「AMD 將研發資源集中給 Zen 4,沿用 7 奈米製程的 Zen 3 只是調校完畢的完善版」的觀點。 這就讓筆者不得不想到之前在「Linus Torvalds 對 AVX-512 的批評是否公道」一文中,文末寫了三個假設: 假如英特爾(Intel)製程技術維持領先地位,今天還會有這樣的「雜音」嗎? 如果 AMD 日後也支援 AVX-512,也沒碰到英特爾的降低時脈麻煩,Linus Torvalds 的反應會不會不一樣? 從 Alder Lake 開始,Intel「似乎」在主流桌上型處理器,開了取消 AVX-512 第一槍,是否意味 AVX-512 將淡出個人電腦舞台? 筆者沒事看到那種「AVX-512 砍掉就砍掉,淡出就淡出,沒什麼大不了」的幼稚言論,就只會納悶,講這種話的人到底有沒有想過一件事:英特爾真這樣幹了,哪天 AMD 反過來全面支援 AVX-512 並標榜「宣稱他們家的產品享有最滴水不漏的 x86 軟體相容性」反打英特爾一槍,那該怎麼辦?順便一提,VIA Centaur 睽違多年的全新 x86 處理器 CHA,也具備 AVX-512 了,手腳竟然還比 AMD 還快,至於完整度如何在此不予置評。 總之我們先回稍微回顧一下「始作俑者」英特爾在「x86 義和團之亂」的退潮期,是如何為了讓 Larrabee 的徒子徒孫,有一條轉戰高效能運算與人工智慧的退路,而讓 AVX-512指令集變成「讓 x86 指令集再度碎片化」的地雷。 「計算機結構」(Computer Architecture)一詞,源自於歷史上首款可回溯相容軟體的 IBM S/360 大型主機,意味著指令集架構(ISA,Instruction Set Architecture)相同的電腦,可執行同樣軟體。基於維護軟體相容性和「生態系統一致性」,指令集一向是「易加難砍」,讓資產和包袱成為一枚硬幣的兩面。 80×86 指令集因長期缺乏業界公定版本標準的關係,而導致碎片化問題,原本隨著實質的玩家只剩下英特爾與 AMD(加上毫無存在感的俄羅斯 Elbrus,與台灣的 VIA),AMD 也放棄了 SSE5,「皈依」英特爾 AVX,而漸漸雲淡風輕。 但英特爾在 Xeon Phi 與 Sky Lake-SP 導入的 AVX-512,不僅吹皺一池春水,在 2018 年首款「實驗性 10 奈米製程」Cannon Lake,首度將 AVX-512 指令集放到個人電腦處理器,這等於是打開潘朵拉的寶盒,因為這代表當時的英特爾相信他們的製程技術,有辦法「硬吃」AVX-512 激增的電晶體數量與耗電量。 事後證明,英特爾完全失算,放棄行之有年的鐘擺(Tick Tock)節奏,進入被外界戲稱「擠牙膏」的「三段論」(新製程→新架構→最佳化)時期後,除了高不可攀的 Skylake-X與「逆向硬幹 Sunny Cove 核心」的 Rocket Lake,沒有任何一款桌上型處理器支援 AVX-512,這等於是對過去自負「我家產品擁有最佳 x86 軟體相容性」的英特爾,狠狠打自己一巴掌。 更糟糕的是,英特爾自己也讓 AVX-512 的版本變得混亂不堪,一再上演「新產品不見得相容舊產品」的戲碼。以剛上市的第十一代 Core Rocket Lake 為例,因為 Cypress Cove核心是「14 奈米製程硬幹出 10 奈米製程 Sunny Cove」,所以 Tiger Lake 的 Willow Cove 核心多出來的 VP2INTERSECT,就這樣不見了。 英特爾在 2019 年鬧出的「Cooper Lake-SP 腰斬事件」是另一則慘案,為了滿足某個「超級大客戶」 (據稱是 Facebook)的深度學習需求,讓第三代 Xeon-SP 平台 Whitley 的先發處理器 Cooper Lake-SP 支援 bfloat16(然後因不明原因被中途腰斬,保留 Cedar Island 平台的 Cooper Lake-P),反倒是後面 10 奈米製程的 Ice Lake-SP 卻付之闕如,須等到第四代 Xeon-SP 平台 Eagle Stream 的 Sapphire Rapids。 最歡樂的莫過於「Golden Cove 大核+Gracemont 小核」的 Alder Lake,為了確保大核小核彼此之間的指令集相容性,Golden Cove 的 AVX-512 直接被「閹割」掉。這就回到另一個大哉問:假使哪天英特爾被 AMD 逼著所有產品都非得要有 AVX-512 不可,那英特爾真的也要讓新一代 Atom 體系小核支援 AVX-512 嗎? 說到最後,這一切的亂象,都是英特爾自己內部一堆「不安定因素(有看過灌籃高手湘北對陵南那場的讀者,一定知道筆者想表達的意思)」累積到一定程度後的「業力引爆」:搶救 x86 義和團的遺產、一窩蜂猛衝人工智慧、製程轉換青黃不接,讓英特爾在 AVX-512 相容度前腳踩後腳,從頭到尾都是自己人搞出來的問題,完全怨不得人。 話說回來,假若 AMD 真的在 Zen 4 靠著台積電 5 奈米製程,實現了「大致完整」的 AVX-512 相容性,並一舉解決過往執行 AVX 指令會大幅降低處理器時脈的宿疾,那英特爾昔日最自傲的「x86 指令集相容性」就將被 AMD 反將一軍。讓人不得不期待,這天一旦發生,英特爾該如何應對,而新任執行長 Pat Gelsinger 又將做何解釋。這齣好戲,屆時一定非常有趣。 -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 118.160.14.21 (臺灣) ※ 文章網址: https://www.ptt.cc/bbs/PC_Shopping/M.1617842153.A.A8F.html

04/08 08:55, 3月前 , 1F
同分文宣說bfloat16好棒棒 然後就取消了
04/08 08:55, 1F

04/08 08:56, 3月前 , 2F
還side by side比較給你看 作ppt的很挑戰啊
04/08 08:56, 2F

04/08 08:57, 3月前 , 3F
不過平心論是avx有進步 沒那麼燙手了
04/08 08:57, 3F

04/08 09:00, 3月前 , 4F
12代架構avx512是不是真正的閹了?
04/08 09:00, 4F

04/08 09:00, 3月前 , 5F
還有但fuse掉?
04/08 09:00, 5F

04/08 09:11, 3月前 , 6F
沒那麼燙手?RKLi9開AVX512到400W
04/08 09:11, 6F

04/08 09:13, 3月前 , 7F
看不太懂這篇重點是什麼...
04/08 09:13, 7F

04/08 09:16, 3月前 , 8F
會變耗電
04/08 09:16, 8F

04/08 09:27, 3月前 , 9F
比較基準不一樣啊 同樣的空間可以拿來做其它用途
04/08 09:27, 9F

04/08 09:35, 3月前 , 10F
如果文 是想看齊印特爾投影片嘛?
04/08 09:35, 10F

04/08 09:48, 3月前 , 11F
作者是癡漢水球大
04/08 09:48, 11F

04/08 09:50, 3月前 , 12F
未看先猜水球文
04/08 09:50, 12F

04/08 09:57, 3月前 , 13F
1秒鐘100度,的確沒那麼燙手了
04/08 09:57, 13F

04/08 10:02, 3月前 , 14F
目前Ryzen功耗就算手動要衝上去也是有點難
04/08 10:02, 14F

04/08 10:02, 3月前 , 15F
如果上AVX512 那功耗牆大概會鎖很死
04/08 10:02, 15F

04/08 10:24, 3月前 , 16F
如果跟zen支援AVX2一樣的方法用現有的256bit電路實
04/08 10:24, 16F

04/08 10:24, 3月前 , 17F
作AVX512可行嗎
04/08 10:24, 17F

04/08 10:25, 3月前 , 18F
樓上怎麼跟著一起如果起來了呢?
04/08 10:25, 18F

04/08 10:28, 3月前 , 19F
反正都在如果了嘛,而且只是要做到指令集相容zen以
04/08 10:28, 19F

04/08 10:28, 3月前 , 20F
及示範過了
04/08 10:28, 20F

04/08 11:24, 3月前 , 21F
這篇的重點是說ZEN4若全線支援AVX512,INTEL和
04/08 11:24, 21F

04/08 11:24, 3月前 , 22F
linus會怎麼嘴吧
04/08 11:24, 22F

04/08 11:52, 3月前 , 23F
linux又不是單嘴AVX512,而是嘴Intel基礎不好跑去玩
04/08 11:52, 23F

04/08 11:53, 3月前 , 24F
有的沒沒有的..基本工要是有做好誰會嘴..
04/08 11:53, 24F

04/08 13:26, 3月前 , 25F
Linus是嘴i皇基本功內力沒練好
04/08 13:26, 25F

04/08 13:27, 3月前 , 26F
學些AVX512花拳繡腿 根本不實際
04/08 13:27, 26F

04/08 13:27, 3月前 , 27F
如果用GG製程,開AVX512不高熱降速
04/08 13:27, 27F

04/08 13:28, 3月前 , 28F
Linus就根本不在乎多塞那單位
04/08 13:28, 28F

04/08 15:00, 3月前 , 29F
就是不會嘴XD
04/08 15:00, 29F

04/08 15:36, 3月前 , 30F
Linus生氣是14nm+++已夠熱還塞512
04/08 15:36, 30F

04/08 15:37, 3月前 , 31F
北極熊也很生氣
04/08 15:37, 31F

04/08 15:37, 3月前 , 32F
結果10nm AlderLake反而閹掉512
04/08 15:37, 32F

04/08 15:38, 3月前 , 33F
這要軟體開發者會更不信任這指令集
04/08 15:38, 33F

04/08 15:38, 3月前 , 34F
時有時無的存在感
04/08 15:38, 34F

04/08 16:01, 3月前 , 35F
為了一致性呀,13代小核加強後就加回來了
04/08 16:01, 35F

04/08 16:19, 3月前 , 36F
04/08 16:19, 36F

04/08 16:56, 3月前 , 37F
放著好好的GPU不去用來用AVX512是幹嘛呢
04/08 16:56, 37F

04/08 18:12, 3月前 , 38F
Linus為什麼嘴,怎麼嘴的文章在版上應該都找得到啊
04/08 18:12, 38F

04/08 18:12, 3月前 , 39F
新的avx 其實降頻不多 就是進步啊
04/08 18:12, 39F

04/08 18:13, 3月前 , 40F
只是之前太臭
04/08 18:13, 40F

04/08 18:15, 3月前 , 41F
如果同架構egs 有 12代沒有 這閹割 電晶體是不是還
04/08 18:15, 41F

04/08 18:15, 3月前 , 42F
是浪費了?
04/08 18:15, 42F

04/08 18:20, 3月前 , 43F
看到一半覺得文體很熟悉,點進去果然是痴漢水球
04/08 18:20, 43F

04/08 20:41, 3月前 , 44F
為什麼有人會覺得adl-s的avx512沒辦法enable?
04/08 20:41, 44F

04/09 10:49, 3月前 , 45F
AMD支援intel不要的東西只會變成反潮流
04/09 10:49, 45F

04/09 10:50, 3月前 , 46F
蘋果當年率先不支援flash,證明風向只會跟著領導走
04/09 10:50, 46F

04/09 18:50, 3月前 , 47F
蘋果當年率先(?)搞出不支援跨app讀同一份檔案,
04/09 18:50, 47F

04/09 18:50, 3月前 , 48F
請問後來變成怎樣了XD
04/09 18:50, 48F

04/09 18:50, 3月前 , 49F
風向跟潮流是怎麼走的? XDD
04/09 18:50, 49F

04/09 19:19, 3月前 , 50F
嗯嗯 所以輸精管接回去就能用了
04/09 19:19, 50F

04/11 05:55, 3月前 , 51F
認真問 其實AMD/VIA的實做可以不用做到性能實做吧?
04/11 05:55, 51F

04/11 05:55, 3月前 , 52F
只要指令集相容、管他幾個cycle幹完,
04/11 05:55, 52F

04/11 05:55, 3月前 , 53F
背後用AVX256跑不行嗎?
04/11 05:55, 53F

04/11 05:56, 3月前 , 54F
這樣至少軟體層面相容, 也不會浪費一堆電晶體
04/11 05:56, 54F
文章代碼(AID): #1WRa_fgF (PC_Shopping)
文章代碼(AID): #1WRa_fgF (PC_Shopping)