[轉錄][乖寶寶] K8 相關之雜湊大全 (一)
看板hardware (電腦硬體)作者Dopin (BrdStar Infor. Service)時間20年前 (2004/12/02 12:00)推噓0(0推 0噓 0→)留言0則, 0人參與討論串1/1
※ [本文轉錄自 Dopin 信箱]
作者: Dopin.bbs@bbs.gamer.com.tw
標題: [乖寶寶] K8 相關之雜湊大全 (一)
時間: Thu Dec 2 11:42:12 2004
作者: Dopin (ats.bsd.com.tw) 看板: Hardware
標題: [乖寶寶] K8 相關之雜湊大全 (一)
時間: Wed Nov 24 20:03:10 2004
本文可能有錯誤 有勞各位先進不吝指正
[寫在前面]
嗯 基本上就是自己的文章抄來抄去改格式 修改彙整 在 K8 的領域我發表了很多文
章 有對有不對 但發現不管回了幾篇 回了幾次 永遠有些基本的問題不斷的被提及
先日在連線板發過一篇相關的文章 本文為其之再補強 而本文有提到的文章 在本板
出現的 於發完文後三天內會陸續自爆
又 本文有時效性 主針對現在的 K8 做一概略性的介紹 從簡單名詞到採購指南等等
一般性知識 而不深究專門的主題 之於工作站等級的部份也僅量不涉及
[什麼是 K8]
K8 全名 AMD Athlon 64 與其相關家族的簡稱 而 "64" 就是支援 64 位元指令集的
意思 然而 K8 並不是最早使用 64 位元架構的 CPU 不過卻是第一群針對 PC (個人
電腦) 相關市場而誕生的 64 位元 X86 家族 (如 Power G5/Intel IT 即為 64 位
元的設計 但非 X86 架構)
事實上一般的 PC 市場仍是 32 位元的主流天下 突然冒出一個主打 64 位元的 CPU
除了增加使用者困擾之外 也予人稍嫌過早的感覺 不過 K8 最難能可貴的是 -- K8
的 32 位元效能表現十分出色 甚至在部份項目勝過了目前市場主流的 Pentium 4
從發表至今 K8 目前的主流分成三種腳位 Socket 940/939/754 目前分別定義在 工
作站 / 中高階個人電腦 / 中階個人電腦 的三個領域 (低階的推出了 Sempron <散
步龍> 以取代原先的 AMD Athlon XP) 而 S940/S939 的 K8 中 有所謂的 FX 等級
CPU 像徵性的宣示所謂 "高階 K8"
[什麼是 PR 值]
約略在 Pentium iii 的時代以前 AMD 與 Intel 的效能與時脈是同步的 兩家公司
在時脈的競賽上互有勝負 效能的表現也各有所長 (註一) 不過 這種互動平衡到了
Pentium 4 以後 戰況有了改變
Intel 推出的新架構 讓時脈的提升更為顯著 隨著半導體技術進步 新製程讓 Intel
的 CPU 時脈節節升高 突破了 1 Ghz 後沒過多久 Intel 就邁向 2 Ghz 乃至現今將
近 4 Ghz 的高峰 無法跟上時脈競賽的 AMD 形同一大挫敗 最後 AMD 想出一種轉寰
的方法 就是採用所謂的 PR 值表示法 ...
以往我們都用時脈來認知 CPU 的速度 但這樣下去 AMD 等於是一路挨打到結束營業
所以透過一些測試 AMD 在自己的產品上 用時脈的數字加上一個 '+' 號來標示 表
示 "對照於 Pentium 我的效能等於他的多少 Mhz" 於是乎消費者便可以知道 哦 原
來我買這一顆等於是買了 Pentium XXXX Mhz
基本上這種標示法是有爭議 也有誤導的嫌疑 本文並不想對此部份多做說明 但 AMD
的確藉由這個策略(搭配低價策略) 成功的挽回一部份市場 (以 DIY 族為大宗)
[從 K7 到 K8]
從一般俗稱的 Socket A (462) K7 到 K8 一直延續使用 PR 值 但是自從 Intel 使
用所謂的 HT 技術 (Hyper Threading Technology) 之後 Pentium 4 效能又再提升
加上外頻技術的改進 100 -> 200 前端匯流排 (FSB) 效能也同步拉高 (400 -> 800)
使得後期的 K7 對應的 PR 值地位愈見尷尬
直至 Intel 2.4 CG (HT/FSB 800 含以上) 出來以前 AMD Athlon XP 的 PR 值表示
法 (註二) 仍具有參考意義的 但 Intel Pentium 4 CG 問世以後 超過 AMD Athlon
XP 2400+ (TB) 等於必需和另一種標準比較 原先的參考標準頓失 後期的 AMD K7 雖
然有推出所謂的 Barton 核心 (L2 = 512K) 但標示同樣 PR 值的效能 依然不及其對
應時脈的 Pentium 4 CG/EG
這個情況到了 K8 之後有了改觀 ... 首先 K8 的 Opteron (S940) 庰棄了 PR 值 直
接以可串聯之 K8 數量 (如 2XX / 8XX 即代表可使用在最多可以支援幾顆 CPU 的主
機板上) 做編號
隨後 第一批個人電腦級主打的 AMD Athlon 64 (S754) 先以 3000+ 附近的 PR 值打
頭陣 不久後又發表了 Socket 939 規格 (下述) K8 的家族漸漸完整的涵蓋了中高階
AMD CPU 市場 這時 各大論壇也紛紛帶起另一波 AMD VS Intel 的熱潮 各用自己認
可的測試方法對這兩大陣營新產品做效能與效益的評估
因為立場不同 各家的結果也不盡相同 但間接卻得證了一件事 -- K8 的 PR 值已不
似 K7 那麼的不可靠 雖不至於遠遠超越 P4 但真正可謂 "分庭抗禮" 站在平起平坐
的位階上
[K8 概說]
K8 最為人津津樂道的有三項特色
1. 64 位元指令集與暫存器 (相容及延伸 部份新創)
2. HyperTransport Technology (HTT)
3. CPU 內建記憶體控制器
以上三者的原理 已經不是我的程度 與本篇文章該深入研究的 但是基本上我們可以
去理解 :
64 位元相關的部份 表示 K8 可以執行 64 位元的命令 表示他是一顆真正的 64 位
元 CPU (含定址能力) 不過因為 K8 支援兩種執行模式 所以在跑 32 位元作業系統
時 我們可以把他視為一顆強化過的 32 位元的 CPU (註三)
HTT 讓 CPU 與高速裝置間的傳輸更為順暢 也減少了主機板各高速單元運作的效能瓶
頸 對於電腦的整體效能 有顯著的幫助 另外由於 HTT 匯流牌與記憶體匯流排是分開
的 而且 CPU 直接對記憶體動作 某些方面來說 我們甚至可以說 記憶體是 CPU 快取
的一部份 (當然這只是種相當極端誇飾) (註四)
但無獨有偶的 記憶體的頻寬 (Bandwidth) 的測試 K8 屢創嘉績 尤其是 Socket 939
出來以後 記憶體控制器獨立出來的好處益加顯著 但 這並不表示雙通道在 K8 就有
很大的意義 ...
[Socket 754 與 Socket 939]
在一般個人電腦領域中 抓對市場的需要 取決於公司的策略 而 Intel 雙通道 (Dual
Channel) 記憶體的成功 帶動了市場對於雙通道的殷切期盼 由於 Socket 754 並不
支援雙通道技術 所以對於效能要求較高的進階玩家 頗有壯志難伸之感 AMD 適時的
推出了 Socket 939 的 CPU 規格 滿足了這個需求
雙通道之於單通道 效能的提升是確定的 早期的 AMD Athlon 64 FX-51 (為 S940)
確立了 S939 的優勢地位 但由於他被定位為頂級產品 所以價格非常不討喜 宣示意
味仍大於實質意義 直到 3500+/3800+/FX-53 出來為止 S939 依舊是站在雲端附近
的產物
這期間 L1 512/1024 K 的 S754 充斥市面 並沒有帶給 K8 多大的負面評價 因為 K8
真的不一樣 尤其是促成換機潮的幾款重量級大作 S754 的 K8 沒有讓人失望 甚至在
許多相關領域的表現上 領先 Intel P4 一段距離
Intel 並沒有乖乖挨打 Socket T (LGA 775) 的問世 顯示了 Intel 也要帶起另一波
革命的決心 但由於腳步實在跨的太大 一開始的 LGA 775 即發佈對應 DDR II / PCI
Express 等新介面 這個震撼彈威力巨大 卻沒有立即造成廣大迴響 原因出在市場機制
畢竟 DDR II 的價格驚人 PCI-E 產品線並未齊備 (現階段 PCI-E 已漸有成為主流之
氣勢 不論在 P4 或 K8)
Socket 754/939 得到正面評價回應之後 AMD 再推出了平民級的 Socket 939 (3000+
與 3200+) 雖然時脈較同 PR 值的 Socket 754 少了 200 Mhz 但因為支援雙通道 仍
被賦予極高期待 甚至 他是一個中介橋樑 對許多人來說 ...
[單通道 還是 雙通道]
K8 的 S939 (雙通道) 與 S754 (單通道) 的比較十分簡單 但也常造成誤解 在網路
上我以不下十篇的文章說明過其中的差異 但似乎效果有限 而下面轉錄自我文章的相
關要點 (該文主探討 K8 3000+) :
1. 其實雙通道的 3000+ 時脈只有 1800 (1804.1) 左右 效能和 S754 的 3000+ 可
說大同小異 甚至差一些 (Spuer PI 1M 44s VS 47s)
2. 至於 5X 的 HTT 是否比 4X 一定就快 20% 也是要看系統的搭配程度 如果有跑過
記憶體測試就知道了 (要注意 HTT 與 記憶體 匯流排是分開的 by ddNTP <*> 兄)
3. 而 Dual Channel 的 K8 記憶體速度不會就真的比 Single Channel 快到兩倍
下面這個網址 是 AMD 官方網站對於 AMD Athlon 64 3000+ 的評測報告 有興趣的板
友 應該將其視為一個 FAQs 網址
http://www.amdzone.com/modules.php?op=modload&name=Sections&file=index&
req=viewarticle&artid=63&page=1
如果我們參照上市官網的數據 仔細評比會發現 AMD Athlon 64 3000+ (socket 939)
的效能 大致是介於 AMD Athlon 64 3000+ (socket 754) 與 AMD Athlon 64 2800+
(socket 754) 之間 而並非優於 3000+ (S754)
下面是我對於雙通道效能的分析 請比較後思考 ->
原因其實很簡單 -> K8 的雙通道 "現階段" 提升幅度有限 (別忘了某極限論壇的頻
寬記錄是用 MSI K8N Neo2 Platinum 卻只插一條記憶體 <單通道> 跑出來的)
在此以大家最常舉例的 DOOM 3 實測網頁的排名為例 (現在應有新的排名) ->
http://www.anandtech.com/cpuchipsets/showdoc.aspx?i=2149&p=7
1. AMD Athlon 64 FX-53 (2.4 GHz / Socket 939 / L2 = 1024 KB)
2. AMD Athlon 64 3800+ (2.4 GHz / Socket 939 / L2 = 512 KB)
3. AMD Athlon 64 FX-51 (2.2 GHz / Socket 939 / L2 = 1024 KB)
4. AMD Athlon 64 3400+ (2.2 GHz / Socket 754 / L2 = 1024 KB)
5. AMD Athlon 64 3500+ (2.2 GHz / Socket 939 / L2 = 512 KB)
我有幾個結論 :
I 同一個核心下 -> 時脈等同於效能
II 同樣的時脈 同樣的 L2 大小下 -> 雙通道的效能 優於 單通道效能
III 同一個時脈下 -> L2 的大小影響 超過 記憶體雙通道 的影響
IV 時脈差到一定的程度時 -> L2 大小 與 雙通道的優勢 不及時脈的影響大
真正的效能結論 其實也不需要再爭論 實際上的效能結果就是如下所示 (以 3000+
為例) :
1. 3000+ (2.0 GHz / L2 = 1024 KB) Socket 754 (正式鋪貨時改叫 3200+)
2. 3000+ (2.0 GHz / L2 = 512 KB) Socket 754
3. 3000+ (1.8 GHz / L2 = 1024 KB) Socket 754 (感謝 tsounimag8 兄提醒)
4. 3000+ (1.8 GHz / L2 = 512 KB) Socket 939
在此 結論顯示如后 ->
當時脈差到 0.2 GHz 以上時 雙通道的優勢 --絕不及於-- 時脈差異 的影響大
簡單的說 3000+ 左右的 Socket 939 其效能略遜於單通道的 Socket 754 正因為如
此 所以採購策略上 會因應將來升級 K8 時的考量 而有所不同 ...
下一篇整理好後 我會針對 K8 754 與 939 的相關常見產品與晶片做較完整的介紹
(註一) : K7 的初期有一陣子時脈上有稍微領先 P3 而且當時 Athlon 跟 P3 的同時
脈效能也很明顯的不一樣 只是也沒有誰八死誰而已 而是各有長處
<本段由 巴哈姆特電玩資訊站(*) 硬體板板主 rockogl 兄補充註釋>
(註二) : K7 的 PR 值是到 P4 CG 出現後才開始不準的 也就是說到 XP 2400+ 開始
才有灌水 XP 2400+ 以前都還差不多 說 XP 2000+ 以後是灌水 PR 值有點
... 一來也是 K7 的架構快到達極限了
<本段由 巴哈姆特電玩資訊站 硬體板板友 uyfduyjhy 兄補充註釋>
<該段原指 XP 2000+ 以後的 PR 值即有灌水之嫌 經 u 兄指正後修改之>
(註三) : K8 的 定址能力是 40bit 只是整數運算的操作變成可以一口氣運算 8byte
(64bit) 大小的整數 也使得定址上可以不用利用兩個暫存器來完成 只需要
一個就好 整數表示範圍是 0 ~ 2^64-1 (無正負號) 或是 -2^63 ~ 2^63-1
(有正負號)
<本段由 巴哈姆特電玩資訊站 硬體板板主 rockogl 兄補充註釋>
(註四) : 將記憶體比喻成快取是太誇張了 不管怎麼樣 除了 SRAM 之外 CPU 對動態
記憶體的傳輸都一定會有超過 1 clock 的延遲 雖然現在記憶體的讀寫都盡
可能 Pipeline 化讓讀寫的 Throughput 增加 可是 ......... 問題並沒有
完全解決
<本段由 巴哈姆特電玩資訊站 硬體板板主 rockogl 兄補充註釋>
(*) : 巴哈姆特電玩資訊站 http://www.bahamut.org/ telnet://bahamut.org/
<*> : ddNTP 兄是經常出沒於 幽谷(aeug.twbbs.org) KK 城邦(bbs.kkcity.com.tw)
有時會出現在 批踢踢 (ptt.cc) 的硬體板元老
--
Brdstar Information Service Co.., Ltd.
Tel: 886-2-2792-9149
Fax: 886-2-2792-4600
Web: http://www.bsd.com.tw/
--
修改原因 : 錯字 / 2800+ -> 3200+ / 補充 r 兄 與 u 兄所指出的錯誤 / ddNTP 兄
之相關介紹
--
※ Origin: 巴哈姆特<bbs.gamer.com.tw> ◆ From: slave.bsd.com.tw
※ 修改: 2004/12/2 11:41:31 [slave.bsd.com.tw]
--
SOB Pack 已於日前 Release 出 gcc 3.x 版, 歡迎還活在 Maple 2.36 SOB Version
回憶中的朋友們一起來討論下列相關 :
1. maple 2.36 2. SOB 3. Atlantis Version
telnet to ats.bsd.com.tw Boardname : ATSVersion
--
※ 發信站: 批踢踢實業坊(ptt.cc)
◆ From: 203.70.65.28
※ 編輯: Dopin 來自: 203.73.231.195 (06/09 08:20)
hardware 近期熱門文章
PTT數位生活區 即時熱門文章