[轉錄][乖寶寶] K8 相關之雜湊大全 (一)

看板hardware (電腦硬體)作者 (BrdStar Infor. Service)時間20年前 (2004/12/02 12:00), 編輯推噓0(000)
留言0則, 0人參與, 最新討論串1/1
※ [本文轉錄自 Dopin 信箱] 作者: Dopin.bbs@bbs.gamer.com.tw 標題: [乖寶寶] K8 相關之雜湊大全 (一) 時間: Thu Dec 2 11:42:12 2004 作者: Dopin (ats.bsd.com.tw) 看板: Hardware 標題: [乖寶寶] K8 相關之雜湊大全 (一) 時間: Wed Nov 24 20:03:10 2004 本文可能有錯誤 有勞各位先進不吝指正 [寫在前面] 嗯 基本上就是自己的文章抄來抄去改格式 修改彙整 在 K8 的領域我發表了很多文 章 有對有不對 但發現不管回了幾篇 回了幾次 永遠有些基本的問題不斷的被提及 先日在連線板發過一篇相關的文章 本文為其之再補強 而本文有提到的文章 在本板 出現的 於發完文後三天內會陸續自爆 又 本文有時效性 主針對現在的 K8 做一概略性的介紹 從簡單名詞到採購指南等等 一般性知識 而不深究專門的主題 之於工作站等級的部份也僅量不涉及 [什麼是 K8] K8 全名 AMD Athlon 64 與其相關家族的簡稱 而 "64" 就是支援 64 位元指令集的 意思 然而 K8 並不是最早使用 64 位元架構的 CPU 不過卻是第一群針對 PC (個人 電腦) 相關市場而誕生的 64 位元 X86 家族 (如 Power G5/Intel IT 即為 64 位 元的設計 但非 X86 架構) 事實上一般的 PC 市場仍是 32 位元的主流天下 突然冒出一個主打 64 位元的 CPU 除了增加使用者困擾之外 也予人稍嫌過早的感覺 不過 K8 最難能可貴的是 -- K8 的 32 位元效能表現十分出色 甚至在部份項目勝過了目前市場主流的 Pentium 4 從發表至今 K8 目前的主流分成三種腳位 Socket 940/939/754 目前分別定義在 工 作站 / 中高階個人電腦 / 中階個人電腦 的三個領域 (低階的推出了 Sempron <散 步龍> 以取代原先的 AMD Athlon XP) 而 S940/S939 的 K8 中 有所謂的 FX 等級 CPU 像徵性的宣示所謂 "高階 K8" [什麼是 PR 值] 約略在 Pentium iii 的時代以前 AMD 與 Intel 的效能與時脈是同步的 兩家公司 在時脈的競賽上互有勝負 效能的表現也各有所長 (註一) 不過 這種互動平衡到了 Pentium 4 以後 戰況有了改變 Intel 推出的新架構 讓時脈的提升更為顯著 隨著半導體技術進步 新製程讓 Intel 的 CPU 時脈節節升高 突破了 1 Ghz 後沒過多久 Intel 就邁向 2 Ghz 乃至現今將 近 4 Ghz 的高峰 無法跟上時脈競賽的 AMD 形同一大挫敗 最後 AMD 想出一種轉寰 的方法 就是採用所謂的 PR 值表示法 ... 以往我們都用時脈來認知 CPU 的速度 但這樣下去 AMD 等於是一路挨打到結束營業 所以透過一些測試 AMD 在自己的產品上 用時脈的數字加上一個 '+' 號來標示 表 示 "對照於 Pentium 我的效能等於他的多少 Mhz" 於是乎消費者便可以知道 哦 原 來我買這一顆等於是買了 Pentium XXXX Mhz 基本上這種標示法是有爭議 也有誤導的嫌疑 本文並不想對此部份多做說明 但 AMD 的確藉由這個策略(搭配低價策略) 成功的挽回一部份市場 (以 DIY 族為大宗) [從 K7 到 K8] 從一般俗稱的 Socket A (462) K7 到 K8 一直延續使用 PR 值 但是自從 Intel 使 用所謂的 HT 技術 (Hyper Threading Technology) 之後 Pentium 4 效能又再提升 加上外頻技術的改進 100 -> 200 前端匯流排 (FSB) 效能也同步拉高 (400 -> 800) 使得後期的 K7 對應的 PR 值地位愈見尷尬 直至 Intel 2.4 CG (HT/FSB 800 含以上) 出來以前 AMD Athlon XP 的 PR 值表示 法 (註二) 仍具有參考意義的 但 Intel Pentium 4 CG 問世以後 超過 AMD Athlon XP 2400+ (TB) 等於必需和另一種標準比較 原先的參考標準頓失 後期的 AMD K7 雖 然有推出所謂的 Barton 核心 (L2 = 512K) 但標示同樣 PR 值的效能 依然不及其對 應時脈的 Pentium 4 CG/EG 這個情況到了 K8 之後有了改觀 ... 首先 K8 的 Opteron (S940) 庰棄了 PR 值 直 接以可串聯之 K8 數量 (如 2XX / 8XX 即代表可使用在最多可以支援幾顆 CPU 的主 機板上) 做編號 隨後 第一批個人電腦級主打的 AMD Athlon 64 (S754) 先以 3000+ 附近的 PR 值打 頭陣 不久後又發表了 Socket 939 規格 (下述) K8 的家族漸漸完整的涵蓋了中高階 AMD CPU 市場 這時 各大論壇也紛紛帶起另一波 AMD VS Intel 的熱潮 各用自己認 可的測試方法對這兩大陣營新產品做效能與效益的評估 因為立場不同 各家的結果也不盡相同 但間接卻得證了一件事 -- K8 的 PR 值已不 似 K7 那麼的不可靠 雖不至於遠遠超越 P4 但真正可謂 "分庭抗禮" 站在平起平坐 的位階上 [K8 概說] K8 最為人津津樂道的有三項特色 1. 64 位元指令集與暫存器 (相容及延伸 部份新創) 2. HyperTransport Technology (HTT) 3. CPU 內建記憶體控制器 以上三者的原理 已經不是我的程度 與本篇文章該深入研究的 但是基本上我們可以 去理解 : 64 位元相關的部份 表示 K8 可以執行 64 位元的命令 表示他是一顆真正的 64 位 元 CPU (含定址能力) 不過因為 K8 支援兩種執行模式 所以在跑 32 位元作業系統 時 我們可以把他視為一顆強化過的 32 位元的 CPU (註三) HTT 讓 CPU 與高速裝置間的傳輸更為順暢 也減少了主機板各高速單元運作的效能瓶 頸 對於電腦的整體效能 有顯著的幫助 另外由於 HTT 匯流牌與記憶體匯流排是分開 的 而且 CPU 直接對記憶體動作 某些方面來說 我們甚至可以說 記憶體是 CPU 快取 的一部份 (當然這只是種相當極端誇飾) (註四) 但無獨有偶的 記憶體的頻寬 (Bandwidth) 的測試 K8 屢創嘉績 尤其是 Socket 939 出來以後 記憶體控制器獨立出來的好處益加顯著 但 這並不表示雙通道在 K8 就有 很大的意義 ... [Socket 754 與 Socket 939] 在一般個人電腦領域中 抓對市場的需要 取決於公司的策略 而 Intel 雙通道 (Dual Channel) 記憶體的成功 帶動了市場對於雙通道的殷切期盼 由於 Socket 754 並不 支援雙通道技術 所以對於效能要求較高的進階玩家 頗有壯志難伸之感 AMD 適時的 推出了 Socket 939 的 CPU 規格 滿足了這個需求 雙通道之於單通道 效能的提升是確定的 早期的 AMD Athlon 64 FX-51 (為 S940) 確立了 S939 的優勢地位 但由於他被定位為頂級產品 所以價格非常不討喜 宣示意 味仍大於實質意義 直到 3500+/3800+/FX-53 出來為止 S939 依舊是站在雲端附近 的產物 這期間 L1 512/1024 K 的 S754 充斥市面 並沒有帶給 K8 多大的負面評價 因為 K8 真的不一樣 尤其是促成換機潮的幾款重量級大作 S754 的 K8 沒有讓人失望 甚至在 許多相關領域的表現上 領先 Intel P4 一段距離 Intel 並沒有乖乖挨打 Socket T (LGA 775) 的問世 顯示了 Intel 也要帶起另一波 革命的決心 但由於腳步實在跨的太大 一開始的 LGA 775 即發佈對應 DDR II / PCI Express 等新介面 這個震撼彈威力巨大 卻沒有立即造成廣大迴響 原因出在市場機制 畢竟 DDR II 的價格驚人 PCI-E 產品線並未齊備 (現階段 PCI-E 已漸有成為主流之 氣勢 不論在 P4 或 K8) Socket 754/939 得到正面評價回應之後 AMD 再推出了平民級的 Socket 939 (3000+ 與 3200+) 雖然時脈較同 PR 值的 Socket 754 少了 200 Mhz 但因為支援雙通道 仍 被賦予極高期待 甚至 他是一個中介橋樑 對許多人來說 ... [單通道 還是 雙通道] K8 的 S939 (雙通道) 與 S754 (單通道) 的比較十分簡單 但也常造成誤解 在網路 上我以不下十篇的文章說明過其中的差異 但似乎效果有限 而下面轉錄自我文章的相 關要點 (該文主探討 K8 3000+) : 1. 其實雙通道的 3000+ 時脈只有 1800 (1804.1) 左右 效能和 S754 的 3000+ 可 說大同小異 甚至差一些 (Spuer PI 1M 44s VS 47s) 2. 至於 5X 的 HTT 是否比 4X 一定就快 20% 也是要看系統的搭配程度 如果有跑過 記憶體測試就知道了 (要注意 HTT 與 記憶體 匯流排是分開的 by ddNTP <*> 兄) 3. 而 Dual Channel 的 K8 記憶體速度不會就真的比 Single Channel 快到兩倍 下面這個網址 是 AMD 官方網站對於 AMD Athlon 64 3000+ 的評測報告 有興趣的板 友 應該將其視為一個 FAQs 網址 http://www.amdzone.com/modules.php?op=modload&name=Sections&file=index& req=viewarticle&artid=63&page=1 如果我們參照上市官網的數據 仔細評比會發現 AMD Athlon 64 3000+ (socket 939) 的效能 大致是介於 AMD Athlon 64 3000+ (socket 754) 與 AMD Athlon 64 2800+ (socket 754) 之間 而並非優於 3000+ (S754) 下面是我對於雙通道效能的分析 請比較後思考 -> 原因其實很簡單 -> K8 的雙通道 "現階段" 提升幅度有限 (別忘了某極限論壇的頻 寬記錄是用 MSI K8N Neo2 Platinum 卻只插一條記憶體 <單通道> 跑出來的) 在此以大家最常舉例的 DOOM 3 實測網頁的排名為例 (現在應有新的排名) -> http://www.anandtech.com/cpuchipsets/showdoc.aspx?i=2149&p=7 1. AMD Athlon 64 FX-53 (2.4 GHz / Socket 939 / L2 = 1024 KB) 2. AMD Athlon 64 3800+ (2.4 GHz / Socket 939 / L2 = 512 KB) 3. AMD Athlon 64 FX-51 (2.2 GHz / Socket 939 / L2 = 1024 KB) 4. AMD Athlon 64 3400+ (2.2 GHz / Socket 754 / L2 = 1024 KB) 5. AMD Athlon 64 3500+ (2.2 GHz / Socket 939 / L2 = 512 KB) 我有幾個結論 : I 同一個核心下 -> 時脈等同於效能 II 同樣的時脈 同樣的 L2 大小下 -> 雙通道的效能 優於 單通道效能 III 同一個時脈下 -> L2 的大小影響 超過 記憶體雙通道 的影響 IV 時脈差到一定的程度時 -> L2 大小 與 雙通道的優勢 不及時脈的影響大 真正的效能結論 其實也不需要再爭論 實際上的效能結果就是如下所示 (以 3000+ 為例) : 1. 3000+ (2.0 GHz / L2 = 1024 KB) Socket 754 (正式鋪貨時改叫 3200+) 2. 3000+ (2.0 GHz / L2 = 512 KB) Socket 754 3. 3000+ (1.8 GHz / L2 = 1024 KB) Socket 754 (感謝 tsounimag8 兄提醒) 4. 3000+ (1.8 GHz / L2 = 512 KB) Socket 939 在此 結論顯示如后 -> 當時脈差到 0.2 GHz 以上時 雙通道的優勢 --絕不及於-- 時脈差異 的影響大 簡單的說 3000+ 左右的 Socket 939 其效能略遜於單通道的 Socket 754 正因為如 此 所以採購策略上 會因應將來升級 K8 時的考量 而有所不同 ... 下一篇整理好後 我會針對 K8 754 與 939 的相關常見產品與晶片做較完整的介紹 (註一) : K7 的初期有一陣子時脈上有稍微領先 P3 而且當時 Athlon 跟 P3 的同時 脈效能也很明顯的不一樣 只是也沒有誰八死誰而已 而是各有長處 <本段由 巴哈姆特電玩資訊站(*) 硬體板板主 rockogl 兄補充註釋> (註二) : K7 的 PR 值是到 P4 CG 出現後才開始不準的 也就是說到 XP 2400+ 開始 才有灌水 XP 2400+ 以前都還差不多 說 XP 2000+ 以後是灌水 PR 值有點 ... 一來也是 K7 的架構快到達極限了 <本段由 巴哈姆特電玩資訊站 硬體板板友 uyfduyjhy 兄補充註釋> <該段原指 XP 2000+ 以後的 PR 值即有灌水之嫌 經 u 兄指正後修改之> (註三) : K8 的 定址能力是 40bit 只是整數運算的操作變成可以一口氣運算 8byte (64bit) 大小的整數 也使得定址上可以不用利用兩個暫存器來完成 只需要 一個就好 整數表示範圍是 0 ~ 2^64-1 (無正負號) 或是 -2^63 ~ 2^63-1 (有正負號) <本段由 巴哈姆特電玩資訊站 硬體板板主 rockogl 兄補充註釋> (註四) : 將記憶體比喻成快取是太誇張了 不管怎麼樣 除了 SRAM 之外 CPU 對動態 記憶體的傳輸都一定會有超過 1 clock 的延遲 雖然現在記憶體的讀寫都盡 可能 Pipeline 化讓讀寫的 Throughput 增加 可是 ......... 問題並沒有 完全解決 <本段由 巴哈姆特電玩資訊站 硬體板板主 rockogl 兄補充註釋> (*) : 巴哈姆特電玩資訊站 http://www.bahamut.org/ telnet://bahamut.org/ <*> : ddNTP 兄是經常出沒於 幽谷(aeug.twbbs.org) KK 城邦(bbs.kkcity.com.tw) 有時會出現在 批踢踢 (ptt.cc) 的硬體板元老 -- Brdstar Information Service Co.., Ltd. Tel: 886-2-2792-9149 Fax: 886-2-2792-4600 Web: http://www.bsd.com.tw/ -- 修改原因 : 錯字 / 2800+ -> 3200+ / 補充 r 兄 與 u 兄所指出的錯誤 / ddNTP 兄 之相關介紹 -- ※ Origin: 巴哈姆特<bbs.gamer.com.tw> ◆ From: slave.bsd.com.tw ※ 修改: 2004/12/2 11:41:31 [slave.bsd.com.tw] -- SOB Pack 已於日前 Release 出 gcc 3.x 版, 歡迎還活在 Maple 2.36 SOB Version 回憶中的朋友們一起來討論下列相關 : 1. maple 2.36 2. SOB 3. Atlantis Version telnet to ats.bsd.com.tw Boardname : ATSVersion -- ※ 發信站: 批踢踢實業坊(ptt.cc) ◆ From: 203.70.65.28 ※ 編輯: Dopin 來自: 203.73.231.195 (06/09 08:20)
文章代碼(AID): #11hfDGoH (hardware)
文章代碼(AID): #11hfDGoH (hardware)