[測試] I家E core在Ansys Fluent中的效能表現

看板PC_Shopping (個人電腦購買)作者 (曉薙)時間4周前 (2024/06/21 22:39), 4周前編輯推噓53(53032)
留言85則, 57人參與, 3周前最新討論串1/2 (看更多)
懶人包:沒有用 部落格好讀版: https://soulattic.blogspot.com/2024/06/intel-13th-cpuansys-fluent.html 1. 前言 由於工作上時常需要使用CFD(計算流體力學)軟體來模擬,加上對電腦硬體有些認識,成了 成了本次做這一些小測試的契機。 念研究所的時候12代剛上,當時有時間可以進行測試,實驗室的設備費卻已經乾了,因此一 直沒能買有大小核設計的CPU來進行一些CFD運算的測試。我看到的大多說法都說大小核 設計有助於計算密集型的生產力應用,例如渲染、剪片轉檔等等,也確實在Cinebench之類 的跑分軟體中有十分強悍的表現。 網路上國內外的評測都鮮少提到CFD軟體的測試成績,只有少數評測網站會測試開源的CFD軟 體OpenFOAM,但測出來的結果卻差異甚大。 在AnandTech的測試中intel 13/14th 全面領先Ryzen 7000系 在Phoronix的測試中7950x3d卻反將一軍 目前工作上使用的軟體是ANSYS Fluent,因此本文將會以這個軟體做為測試主軸。但合法的 ANSYS軟體一套要價數百萬,只好跟公司借用借用,嘿嘿。 利用了下班時間跑了ANSYS Fluent的Benchmark Case做了一些測試,留個紀錄想要拋磚引玉 2. 測試環境 A. 軟體版本: ANSYS Fluent 23R2 B. Benchmark Case: ANSYS Fluent, External Flow Over an Aircraft Wing (aircraft_2m) C. 網格數量: 2m(200萬) D. 網格類型: Hexa(六面體) E. 紊流模型: realizable k-eps turbulence F. 求解器類型: Pressure based coupled solver, Green Gauss Node based, steady G. 電腦配備: CPU: Intel i7 13700 nonK Cooler: Thermalright BA120 MB: ASUS B760-A WiFi D4 RAM: Kingston Fury DDR4-3200 32GBx2 @3466 SSD: ADATA S70 pro 2TB Case: CM TD500 MESH V2 H. 環境溫度24度C,觀測HWinfo軟體全測試無出現撞溫度牆的狀況。 I. 電源計畫: 高效能 合法的ANSYS Fluent一次最多只能使用4核心運算,想另外加核心數上去就必須購買HPC(Hig h Performance Computing)。 而這個HPC也是動輒百來萬的東西,因此在這邊只使用1個軟體本體+1個HPC的License,總共 總共12核心下去做運算,我想在有限的核心數量下找出最佳的組合也比較符合預算有限的且 只能使用合法軟體的單位。 3. 測試結果 必須要先做說明,我有找到原廠的電腦設定建議,裏頭是建議關掉超執行緒(Hyper-Thread, 因此剛開始測試都是關閉HT的狀況,後來才想說要把HT打開測試看看。 以下是測試結果,橘框是P core: A. 6P6E (no HT) Simulation wall-clock time for 1800 iterations 4085 sec 6P6E是將HT關掉後,在Windows 11下的自動核心調度結果 進工作管理員看是有指定CPU親和性在每個運作的核心上的 https://i.imgur.com/GadJ4lb.png
B. 8P4E (no HT) Simulation wall-clock time for 1800 iterations 3920 sec 8P4E是我在工作管理員中手動將CPU親和性調度到8個P核上的結果 https://i.imgur.com/3XH3Yia.png
C. 全預設 (自由調度) Simulation wall-clock time for 1800 iterations 3630 sec 全預設狀況下把HT重新打開,這時進工作管理員查看會發現CPU親和性沒有被指定 但從工作管理員上可以推斷出應該是跑在12個P核的執行緒上 https://i.imgur.com/uVanIiv.png
D. 8P0E (no HT) SSimulation wall-clock time for 1800 iterations 3683 sec 把小核跟HT都關了,軟體設定8核心運算,只用8C8T下去跑,這個就沒有特別截圖了 E. 8P0E(有開HT,用12個執行緒在跑) Simulation wall-clock time for 1800 iterations 3578 sec 關小核但開HT,看工作管理員,也有指定CPU親和性在前12個執行緒上 https://i.imgur.com/65t7BYt.png
4. 總結 基本上可以將結果分為兩群: i. 有E核參加運算(A、B) ii. 無E核參加運算(C、D、E) https://i.imgur.com/5eo1FTG.png
其中i群內8P4E相較於6P6E快了4.2%,好像有些差別 ii群內8P0E無HT比預設慢了1.4%,8P0E有HT比預設快了1.5%,這應該可以被認為是誤差 i群平均(4002.5s)相較於ii群平均(3630.3s)慢了10.3% 甚至可以從B跟D的比較中發現8P4E比8P0E還慢!! 我認為這可以歸因於CFD的特性,CFD是一種吃重記憶體頻寬的應用。 在消費級平台上只有雙通道的記憶體頻寬被P核和E核共享,結果就是沒有讓速度較快的P核 發揮全部的算力,進而導致整體計算時間拉長。 因為還沒測試過AMD平台,所以不能說全大核的AMD平台就比較好。但可以得到的結論是: 算CFD完全沒有買13900/K的必要,因為P核數量並沒有增加。 以上結果供各位參考,如有關於購買CFD模擬用硬體設備也歡迎留下建議。 -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 1.173.25.76 (臺灣) ※ 文章網址: https://www.ptt.cc/bbs/PC_Shopping/M.1718980761.A.4DA.html ※ 編輯: xiaotee (1.173.25.76 臺灣), 06/21/2024 22:44:15 ※ 編輯: xiaotee (1.173.25.76 臺灣), 06/21/2024 22:46:49

06/21 22:46, 4周前 , 1F
有數據有推
06/21 22:46, 1F
謝謝推

06/21 22:49, 4周前 , 2F
每個小核簇(每4個小核)共用一個記憶
06/21 22:49, 2F

06/21 22:49, 4周前 , 3F
體節點,在memory intensive的程式表現
06/21 22:49, 3F

06/21 22:49, 4周前 , 4F
會很差
06/21 22:49, 4F
感謝說明~

06/21 22:50, 4周前 , 5F
推測試,我以為我在看小論文
06/21 22:50, 5F
其實只是廢話比較多的簡易測試而已

06/21 22:51, 4周前 , 6F
記憶體頻寬 那L3快取大小會不會也有
06/21 22:51, 6F
我印象中看別人測的數據是有差 https://reurl.cc/4r76R2 https://i.imgur.com/P69E3N7.png

06/21 22:55, 4周前 , 7F
原po有沒有考慮7000系也測一篇來比較
06/21 22:55, 7F
沒...沒有多餘的預算了

06/21 22:55, 4周前 , 8F
推測試,太詳細了吧,我還是買AMD好了
06/21 22:55, 8F
謝謝推

06/21 22:56, 4周前 , 9F
喔~沒事 x3d提到評測已經講完了
06/21 22:56, 9F

06/21 23:03, 4周前 , 10F
Intel什麼時候放棄大小核架構
06/21 23:03, 10F
※ 編輯: xiaotee (1.173.25.76 臺灣), 06/21/2024 23:19:11

06/21 23:21, 4周前 , 11F
推分享
06/21 23:21, 11F

06/21 23:23, 4周前 , 12F
是說這台電腦是你自己的還是實驗室的
06/21 23:23, 12F
是...是公司的

06/21 23:24, 4周前 , 13F
吃重記憶體頻寬? 所以用D4跑跟D5理論上來說
06/21 23:24, 13F

06/21 23:24, 4周前 , 14F
應該會有差距?
06/21 23:24, 14F
理論上是這樣,因為同樣D4-3200,跑雙通道、四通道、八通道的求解速度天差地遠

06/21 23:26, 4周前 , 15F
懶人包簡單暴力,害我笑出來
06/21 23:26, 15F
※ 編輯: xiaotee (1.173.25.76 臺灣), 06/21/2024 23:32:57

06/21 23:42, 4周前 , 16F
實驗室的SSD拿S70 Pro我有點擔心
06/21 23:42, 16F

06/21 23:42, 4周前 , 17F
*公司
06/21 23:42, 17F
資料碟而已,系統碟是SN770...XD 不是我配的,不要看我

06/22 00:08, 4周前 , 18F
感謝
06/22 00:08, 18F

06/22 00:10, 4周前 , 19F
有撞功耗牆嗎?
06/22 00:10, 19F
看起來都沒有撞功耗牆喔 有確認過主板內PL1/2都設定在253W 各項測試跑起來最多到160w左右而已

06/22 00:43, 4周前 , 20F
最快的居然是把小核關了w
06/22 00:43, 20F

06/22 01:07, 4周前 , 21F
多核圍觀
06/22 01:07, 21F

06/22 02:17, 4周前 , 22F
我喜歡你這麼粗暴
06/22 02:17, 22F

06/22 03:23, 4周前 , 23F
推 懶人包 XD
06/22 03:23, 23F

06/22 04:45, 4周前 , 24F
簡單粗暴的結論
06/22 04:45, 24F
我怕我廢話太多沒人看QQ

06/22 06:57, 4周前 , 25F
這應該還蠻有參考價值的吧 這種商業軟體很少
06/22 06:57, 25F

06/22 06:57, 4周前 , 26F
人能測 而且原PO也滿詳細的
06/22 06:57, 26F
還有 26 則推文
還有 6 段內文
06/22 11:31, 4周前 , 53F
只差全小核了,這有辦法測嗎
06/22 11:31, 53F
應該是沒有要測全E核啦...畢竟License數量限制在那,當然是用快的下去跑啊!

06/22 11:41, 4周前 , 54F
推 不知道static structural 或Ansys
06/22 11:41, 54F

06/22 11:41, 4周前 , 55F
lsdyna是不是一樣結果
06/22 11:41, 55F
謝謝推,也希望有人可以跑跑Benchmark case囉~

06/22 12:12, 4周前 , 56F
有數據給推
06/22 12:12, 56F

06/22 12:22, 4周前 , 57F
謝謝
06/22 12:22, 57F

06/22 12:31, 4周前 , 58F
優文
06/22 12:31, 58F

06/22 13:53, 4周前 , 59F
06/22 13:53, 59F

06/22 13:55, 4周前 , 60F
E核到底有沒有用我覺得不好下定論,像是20
06/22 13:55, 60F

06/22 13:55, 4周前 , 61F
77我關HT開E核,FPS有比較高一些
06/22 13:55, 61F

06/22 13:55, 4周前 , 62F
但原PO環境下,開E核看起來就是悲劇
06/22 13:55, 62F

06/22 14:05, 4周前 , 63F
大小核主要還是調度問題
06/22 14:05, 63F

06/22 14:26, 4周前 , 64F
有料,推個
06/22 14:26, 64F

06/22 14:44, 4周前 , 65F
謝謝懶人包
06/22 14:44, 65F

06/22 15:29, 4周前 , 66F
06/22 15:29, 66F

06/22 16:19, 4周前 , 67F
推測試
06/22 16:19, 67F

06/22 16:36, 4周前 , 68F
06/22 16:36, 68F

06/22 17:11, 4周前 , 69F
全大核沒有問題
06/22 17:11, 69F

06/22 18:25, 4周前 , 70F
之前測試過公司用的Flotherm
06/22 18:25, 70F

06/22 18:26, 4周前 , 71F
跟樓主的結論差不多
06/22 18:26, 71F

06/22 18:26, 4周前 , 72F
關掉HT,關掉E核會比較快
06/22 18:26, 72F

06/22 18:27, 4周前 , 73F
另外記憶體頻寬大速度明顯有差
06/22 18:27, 73F
謝謝回報,其實我也測過FloTHERM,但我忘記留數據就沒有寫成文章了 但有發現沒有改高效能電源計畫的話會全跑在E核上 XD FloTHERM還有N卡會閃退的問題...

06/22 18:57, 4周前 , 74F
看不懂QQ 為什麼有E反而比沒E慢
06/22 18:57, 74F
白話一點就是,E核加入運算之後,P核需要等E核算完才能算下一步~

06/22 19:31, 4周前 , 75F
推測試,不過買的起這軟體,至少要上64核
06/22 19:31, 75F

06/22 19:31, 4周前 , 76F
心吧,不會用家用型
06/22 19:31, 76F
64核要用3個HPC,請問軟體要花多少錢呢(X 這類軟體一個很大的問題就是用越多核心數的機器運算也代表要花越多錢買軟體 哈哈

06/22 19:39, 4周前 , 77F
哪有差不多,樓主不關HT比較快吧
06/22 19:39, 77F

06/22 20:28, 4周前 , 78F
開HT就該比較快 關HT是考量增幅太小
06/22 20:28, 78F

06/22 20:32, 4周前 , 79F
(這裡增幅小因為被記憶體頻寬限制住)
06/22 20:32, 79F

06/22 20:35, 4周前 , 80F
如果沒有記憶體瓶頸 例如測cb 那HT分
06/22 20:35, 80F

06/22 20:35, 4周前 , 81F
數還是有顯著差異 (耗電也UP就是了)
06/22 20:35, 81F
我印象中有同事跟我說他開/關HT測另一款CFD軟體 Star-CCM+,會快一點點點 就真的一點點

06/22 22:27, 4周前 , 82F
有數據有推
06/22 22:27, 82F

06/22 23:32, 4周前 , 83F
大推~剛使用12700H關E核跑PICS3D也快17%
06/22 23:32, 83F
謝謝測試 ※ 編輯: xiaotee (1.173.25.76 臺灣), 06/23/2024 01:08:06

06/23 09:39, 3周前 , 84F
06/23 09:39, 84F

06/23 19:22, 3周前 , 85F
期待A家測試
06/23 19:22, 85F
文章代碼(AID): #1cTP2PJQ (PC_Shopping)
文章代碼(AID): #1cTP2PJQ (PC_Shopping)