Re: [問題] Intel 3.2g 和 AMD 3500+ 939 到底괠…
※ 引述《Dopin (大鵰傳說)》之銘言:
: ※ 引述《ULTIMA1002 (my story)》之銘言:
: : 所以我覺得K8的優勢被現在快速發展的顯示卡市場給蓋過了
: 如果你是玩 天堂 II 或是 FF XI 你就會發現 CPU 還是有差 P4 永遠有
: 跟不上的先天缺憾 反之 DOOM 或是 Far Cry 就差不多
: 真正的狀況 : 遊戲影響大小 和程式的寫法也很有關係 不會只差在顯示卡
: => 不然大家都用賽揚和散步龍 配高階顯卡就好 不是嗎 ? (當然不可能)
: : 而P4不管是轉檔剪接的優勢還是HT的多工都不能被其他硬體所取代...
: 轉檔也要看寫法 現在優勢就是軟體廠商優化多 所以差異很大
: 真的在跑新版的軟體時 兩者的差異只會變小 不會變大 其來有自
: : 總覺得在遊戲之外P4好用很多
: : 這是我個人的觀點啦...有錯請指教
: HT 的多工是把不用的指令集模擬成另一個 CPU 不代表你真的有兩倍的效
: 能可以用 也許我們今天所執行的程式用到的不太一樣 那 HT 效能可以有
: 效發揮 但如果你跑些多元轉檔或是多指令集程式呼叫 你會發現開 HT 可
: 能只會更慢不會更快
: 最糟的狀況下 在執行一些寫作較差的應用程式時 因為運算分配 還有所為
: 的多時保護 (避免某個程式吃掉了所有的中斷資源) 開 HT 往往會讓你的效
: 能限制在上限 50% 如果某程式用到大部份指令集 對於 HT 的效用傷害是
: 很大的 當然這和 Intel 現階段的實作不是很成功也很有關係 (註一)
"HT讓你的效能限制在上限 50%" ??
請參考下面這篇文章,
http://anandtech.com/cpuchipsets/showdoc.aspx?i=1746&p=6
單就下面那張圖表來看, 何來效能上限在50%之說?
以WinRAR為例, 他壓縮的部分根本就不是針對Multi-threading特別撰寫的,
效能也沒什麼影響, 更沒有荒謬到效能上限在50%這種情形發生
既使是圖表中效能下降最嚴重的benchmark -- CCWS2K2
也只有下降7%, 當然唸過計算機組織的都知道
一個系統的效能(就讓我們以程式執行時間作為評量效能的指標吧)
並不是單一元件變慢多少系統就會一樣慢多少 -- 這是顯而易見的
但若您所說的 "HT讓你的效能限制在上限 50%" 成立,
那您大可找找看同核心的P4, 在何種核心工作頻率下, 不開HT
在FSB, Memory, 以及其他周邊的零件都一樣的系統, 跑出來的數據可以
達到P4 3.06G 不開HT情況下的 0.93, 順便驗證一下當時的核心工作頻率
是不是就真的是P4 3.06G的50%.
請就事論事證明我是錯的, 期待您的結果.
(我相信以貴公司的資源, 應該是不缺零組件的, 當然不一定要用P4 3.06G
任何一系列具備HT能力的P4核心都很適合您的實驗, 祝您實驗順利)
另外, 關於您文中用到的那一堆自己重新定義過的術語, 我也懶得再提了
免得您又覺得我是情緒性發言.
不過如果連 指令集/pipeline/function unit都不分的話, 我想您應該是沒唸過
計算機組織學吧. 沒完全弄懂的話, 就請不要再拿某些專業科目來壓人.
(一開始我以為您是有唸過/念懂的, 還熱心想要盡力比喻給其他板友聽,
沒想到不解釋還好, 一解釋下來反而開始亂用術語, 而且觀念還明顯有偏頗)
上文還有一個特別牛頭不對馬嘴的地方
"避免某個程式吃掉了所有的中斷資源"
我最好奇的是, 什麼叫做程式吃掉(佔據 -- 這應該符合您的原意吧)
所有的中斷資源?
: 最後 ...
: 認為 K8 只有遊戲行 或是 P4 只有轉檔行 是錯誤的
: 但認為 P4 運算一定比較強 K8 3D 一定比較強 也是錯誤的
: 真正重要的是 軟體的寫法和支援方式 還有使用的部份
: 同樣是跑 MATLAB 或是 FORTRAN 77 因為應用的領域與函式呼叫的不同
: 兩陣營在同樣的應用軟體下表現可好可壞 端看你用什麼方式去用軟體
: 看到 P4 就說 P4 好我固然不喜歡 但是遇到 K8 就只說 K8 好的同樣讓
: 人討厭 看事情要看需求 只不過遊戲目前的需求 K8 佔優勢 而 95% 以
: 上的 PC 主要用途都是遊樂 如此而已
: 價格和喜好因素 那還是其次 可是 DIY 市場 荷包重不重要 可不能輕忽
: 註一 : 如同 littleshan 兄所言 良好的程式對稱性 (翻譯各有不同) 可
: 以讓 HT 有效發揮 (請參考 l 兄之回文 與下面我的再回應)
: instruction parallelism 屬於進階的程式效能研究主題 為程式
: 語言之進階 用白話說就是如何讓程式 "妥善利用" CPU 及相關資
: 源 讓程式執行起來更有效率 更加全面
如果說明的這麼籠統, 那不是跟沒講一樣?
此外, 您也徹底扭曲littleshan的意思了
他的原文節錄如下
"事實上 擁有良好instruction parallelism的程式 在單一process的情況下
還是能發揮cpu接近全部的運算能力"
而不是什麼 "良好的程式對稱性 可以讓 HT 有效發揮"
他原來的意思是說, 一個不是Multi-threading的程式如果具有高度的
Instruction-level Parallelism, 那不用HT一樣可以壓榨出P4的實力
: 另外 有人問我就再說 SMT 和 SMP 是不一樣的 ^^;;;
--
※ 發信站: 批踢踢實業坊(ptt.cc)
◆ From: 140.113.209.62
推
163.25.118.42 06/09, , 1F
163.25.118.42 06/09, 1F
推
218.32.98.1 06/09, , 2F
218.32.98.1 06/09, 2F
推
59.114.43.98 06/09, , 3F
59.114.43.98 06/09, 3F
→
59.114.43.98 06/09, , 4F
59.114.43.98 06/09, 4F
→
59.114.43.98 06/09, , 5F
59.114.43.98 06/09, 5F
推
163.13.225.177 06/09, , 6F
163.13.225.177 06/09, 6F
推
140.116.164.228 06/09, , 7F
140.116.164.228 06/09, 7F
→
140.116.164.228 06/09, , 8F
140.116.164.228 06/09, 8F
推
163.13.225.98 06/09, , 9F
163.13.225.98 06/09, 9F
→
163.13.225.98 06/09, , 10F
163.13.225.98 06/09, 10F
推
192.192.197.35 06/10, , 11F
192.192.197.35 06/10, 11F
推
140.109.32.9 06/10, , 12F
140.109.32.9 06/10, 12F
→
140.109.32.9 06/10, , 13F
140.109.32.9 06/10, 13F
推
203.70.65.28 06/13, , 14F
203.70.65.28 06/13, 14F
推
02/24 22:15, , 15F
02/24 22:15, 15F
討論串 (同標題文章)
本文引述了以下文章的的內容:
完整討論串 (本文為第 3 之 4 篇):
hardware 近期熱門文章
PTT數位生活區 即時熱門文章