Re: [問題] 如何計算CPU的峰值浮點計算能力FLOPS
※ 引述《micklin (mick doohan)》之銘言:
: ※ 引述《aada (aada)》之銘言:
: : 處理器個數*處理器主頻*每秒可進行的最高浮點運算次數 = 浮點算峰值,
^^^^ clock cycle
: http://www.intel.com/support/processors/sb/cs-023143.htm
看這個表
i7-975 就是 16 flop/cycle
i7-620 就是 8 flop/cycle
所謂 峰值(peak) 就是理論值.
浮點運算器通常都使用 piple line architecture , 不管分
了多少個 stage , 理論上就是每個 clock cycle 移動一級,
看 pipleline 出口處就是最快每個 cycle 產出一個結果.
每條 pipleline 若無特殊設計, 那就是 flop/cycle.
多核心時代, IC 面積不要錢, 就多抄幾條 floating point
pipeline 進去. 所以都是整數值.
Intel X86 CPU 的外裝 clock 振盪器一向要被處理成非對稱
的 2 Phase clock 才用於內部. 8086 的整數乘除記得是 72
machine clock cycle, 她的 machine clock cycle 是 1/4
外部 clock.
既然是 peak 值, 那就算有幾個 floating pipleline 用那
個 clock rate 乘起來算. 至少這是理論上限.
: 可以查到intel cpu的flops. 表格中的數據與你查到的不同.
: GFLOPS是算出來的, 每秒可以跑幾Giga次的浮點數運算.
: 以多核而非多實體處理器來看, 4核心是不是表示GFLOPS可以變4倍,
: 有請高手回答.
: 我個人認為, Intel公佈的數據是整體的GFLOPS, 而非單核運作時的數據.
: 請參考 http://www.intel.com/support/processors/sb/cs-017346.htm
這網站說明的很不錯, 已經暗示是外銷第三世界(譬如喜歡 500 大的地區)
要滿足美方禁運法規又要滿足海外顧客需求, 擺明就是搶標案用的.
: 用你的公式來看, 得到的答案是 「每秒每Hz可進行的最高浮點運算次數」
: 如果架構相同, 只有時脈不同, 那你得到的值應該是一樣的.
那張表, 同一種製程系列的 flop/cycle 都相同.
※ 編輯: ggg12345 來自: 140.115.4.12 (06/21 20:38)
討論串 (同標題文章)
本文引述了以下文章的的內容:
完整討論串 (本文為第 3 之 3 篇):
CSSE 近期熱門文章
PTT數位生活區 即時熱門文章