Re: [情報] 改架構拼28nm，AMD顯卡7000呼之欲出

看板PC_Shopping (個人電腦購買)作者jk21234 ( 1569 11 /47)時間15年前 (2011/06/29 18:04)推噓60(60推 0噓 16→)

留言76則, 63人參與討論串1/1

這個解讀似乎有很大的誤解...... 如果前一個洩漏的HD7000設計的投影片不是假造的話, 那麼HD7000並非放棄VLIW架構,反而是VLIW/SIMD雙模式. 但這種設計還比純粹的VLIW複雜一點...可能不太多啦, 畢竟以複雜度以及彈性來說VLIW高於SIMD,所以它的骨子裡面仍然是VLIW. 可是增加一個SIMD的支援有甚麼好處?SIMD能做的VLIW也通通能做啊... 例如,SIMD幫四組資料作加法: ADD (x1,x2,c1),(x3,x4,c4),(x7,x9,c8),(x9,x10,c3) VLIW下就是: ADD (x1,x2,c1);ADD (x3,x4,c4);ADD (x7,x9,c8);ADD (x9,x10,c3) 最明顯的差別就是SIMD只要指定做一個ADD,四組資料會一樣的動作, 可是缺點就是它這四組得做同樣的動作.要想兩個去做加法兩個去做乘法就不行了......實際對應到硬體實作,就是SIMD版本的指令會使用比較少的byte, VLIW的會比較多,這其實有不少的好處,因為DirectX下的shader code有限制指令 buffer的長度,能用SIMD模式的話,例如原本塞800個指令是上限,可以多個1.5~2X, 做出更複雜的特效.搭配指令快取也會有比較好的效率....不過好處僅此為止. 把所有可能性都納入考慮的話,HD7000的改變有可能為: 1.VLIW/SIMD雙模僅是過渡期,VLIW是相容,未來才會被取消掉. 老實說不太可能,跳去作純SIMD會造成災難性的問題. 我不用理論舉例好了...R600(HD2000)就是一個與其說VLIW但因為限制較大還稍為接近SIMD的指令架構,R600跟R770(HD4000)的性能對比如何相信大家都很清楚.....比R600更接近純SIMD會怎樣? 而且改成SIMD,編譯器不會比較好作,加上DX GPU現在是拿虛擬的組合語言去餵給driver,driver幫你最佳化重排.這個在純SIMD模式下不會省掉最佳化的需求.只會更難做.假設以往的5D VLIW的compiler(IL to 硬體)複雜度是10, 那nVidia那邊的架構也會依賴(ptx to硬體),但簡單一點複雜度可能只有2 純SIMD下對compiler的依賴度可能一下跳到30以上. 要是這樣只能期待每個開發者都有一堆手寫組合語言大軍支持你.... 不過ATI/AMD的GPU過去不管(只算n+A)市占6成還是4成,業餘開發者以ATI/AMD GPU為標準的差不多都是2成上下.....那這方面還是它在現實中的弱勢. 所以放棄掉VLIW的確是不合理..... 2.VLIW/SIMD雙模式是新架構. 好處就是前面說的做某些事情的指令可以變短,但考慮到會因此增加指令編碼的複雜度,也會增加硬體上指令解碼的額外複雜度.所以相抵之下可能不會比原有的 VLIW多塞入到2X的指令數量....再說現有的指令緩衝區大小,如果只是Pixel Shader 以及Vertex Shader等繪圖特效,指令上限數是很夠用很難用完的. 但是GPGPU,或者是想在遊戲上拿GPU幫你計算物理模擬的時候,這時候需要的指令總數可能會比硬體一次能塞的多非常多......由於分段載入多少還會影響效能, 因此這個擴充到SIMD的方向在GPGPU以及物理模擬上會有很大的好處.... 還有一個好處是在願意手寫GPU code的人上,假設新版的IL提供了SIMD的指令版本, 那花腦力手動寫IL,就可以在平行度很高的地方自行通通用SIMD版本下去寫,跳過 compiler的最佳化.... == 其實nV那邊就是一個說VLIW也可以但這因素不重要的硬體架構啦... -- ※ 發信站: 批踢踢實業坊(ptt.cc) ◆ From: 114.37.171.58

推

quarter411

06/29 18:05, , 1^F

06/29 18:05, 1^F

推

friedpig

06/29 18:06, , 2^F

06/29 18:06, 2^F

推

Lansbury

06/29 18:10, , 3^F

06/29 18:10, 3^F

推

ICEFTP

06/29 18:12, , 4^F

06/29 18:12, 4^F

推

qioip

06/29 18:13, , 5^F

06/29 18:13, 5^F

推

batschris

06/29 18:14, , 6^F

06/29 18:14, 6^F

推

ArSaBuLu

06/29 18:16, , 7^F

06/29 18:16, 7^F

推

ChangWufei

06/29 18:17, , 8^F

06/29 18:17, 8^F

推

zxcvbnm00316

06/29 18:18, , 9^F

06/29 18:18, 9^F

推

batschris

06/29 18:21, , 10^F

06/29 18:21, 10^F

推

celestialgod

06/29 18:23, , 11^F

06/29 18:23, 11^F

推

silver2012

06/29 18:24, , 12^F

06/29 18:24, 12^F

→

rex105

06/29 18:25, , 13^F

06/29 18:25, 13^F

推

ebolalala

06/29 18:27, , 14^F

06/29 18:27, 14^F

推

biostrike

06/29 18:30, , 15^F

06/29 18:30, 15^F

推

Ekmund

06/29 18:35, , 16^F

06/29 18:35, 16^F

推

louis0407

06/29 18:45, , 17^F

06/29 18:45, 17^F

推

halow

06/29 18:48, , 18^F

06/29 18:48, 18^F

推

maplemeowcat

06/29 18:48, , 19^F

06/29 18:48, 19^F

推

Alertme

06/29 18:50, , 20^F

06/29 18:50, 20^F

→

Nappa

06/29 18:50, , 21^F

06/29 18:50, 21^F

推

lyt316

06/29 18:54, , 22^F

06/29 18:54, 22^F

推

Cadia

06/29 18:56, , 23^F

06/29 18:56, 23^F

→

HSKao

06/29 18:57, , 24^F

06/29 18:57, 24^F

推

MK47

06/29 18:59, , 25^F

06/29 18:59, 25^F

推

james1201

06/29 19:07, , 26^F

06/29 19:07, 26^F

推

karl7238

06/29 19:13, , 27^F

06/29 19:13, 27^F

推

EndlessYearn

06/29 19:17, , 28^F

06/29 19:17, 28^F

推

taipeiliu

06/29 19:36, , 29^F

06/29 19:36, 29^F

推

AXby

06/29 19:37, , 30^F

06/29 19:37, 30^F

推

H264

06/29 19:38, , 31^F

06/29 19:38, 31^F

推

vitoman

06/29 19:39, , 32^F

06/29 19:39, 32^F

推

justlovenene

06/29 19:43, , 33^F

06/29 19:43, 33^F

推

chugliang

06/29 19:44, , 34^F

06/29 19:44, 34^F

→

a3939889

06/29 19:49, , 35^F

06/29 19:49, 35^F

推

lsslss

06/29 19:54, , 36^F

06/29 19:54, 36^F

推

Umol

06/29 19:56, , 37^F

06/29 19:56, 37^F

推

virus2007

06/29 19:57, , 38^F

06/29 19:57, 38^F

推

shiyeh

06/29 20:22, , 39^F

06/29 20:22, 39^F

→

Nappa

06/29 20:24, , 40^F

06/29 20:24, 40^F

推

suzukihiro

06/29 20:24, , 41^F

06/29 20:24, 41^F

推

Egami

06/29 20:25, , 42^F

06/29 20:25, 42^F

→

tsukiyomi

06/29 20:31, , 43^F

06/29 20:31, 43^F

→

q0325

06/29 20:32, , 44^F

06/29 20:32, 44^F

推

RHTZ

06/29 20:32, , 45^F

06/29 20:32, 45^F

推

suzukihiro

06/29 20:33, , 46^F

06/29 20:33, 46^F

→

suzukihiro

06/29 20:33, , 47^F

06/29 20:33, 47^F

→

RHTZ

06/29 20:34, , 48^F

06/29 20:34, 48^F

推

suzukihiro

06/29 20:36, , 49^F

06/29 20:36, 49^F

推

atana

06/29 20:42, , 50^F

06/29 20:42, 50^F

推

davidbright

06/29 20:56, , 51^F

06/29 20:56, 51^F

我覺得沒有就是一代一代的慢慢作改變下去,走VLIW/SIMD雙模式是種漸進的發展. DX以來的顯卡晶片很少在一代就有重大的革命,唯一的例子是在踏入DX10的時候, 改US等於砍掉重來.結果就是我們看到的HD2900還有8600GT的晶片面積/效能比...... 從舊有的VLIW過渡到VLIW/SIMD雙模式,平均每個SP占用的面積會增加一些, 不過它的好處如上所示.就算GPGPU的增益可能最大(附帶搭配HD7000其餘的改進.可以發現它的改變程度不下於當初的Fermi),這部分在繪圖性能上也會有好處.還有就是願意手動最佳化的開發者也可以得到比原有VLIW架構更好的效果.. 但是放棄掉VLIW變成純SIMD除了簡化硬體設計很多以外,壞處更多. 再說若是SIMD模式可行的話,別說今天的GPU廠商不會門檻高到只有n+A, 連Cell都有可能擔任GPU了. 另走途徑放棄掉VLIW架構不是不可能,但可能出現的模式應該是深度管線或者是類似nV的架構的模式...

推

hollynight

06/29 21:46, , 52^F

06/29 21:46, 52^F

推

mimimaster

06/29 21:50, , 53^F

06/29 21:50, 53^F

推

ttyyoop2003

06/29 22:05, , 54^F

06/29 22:05, 54^F