[請益] 反鋸齒能開高的關鍵是?

看板VideoCard (顯卡板)作者 (小傑克)時間9年前 (2016/04/25 18:30), 9年前編輯推噓5(5036)
留言41則, 7人參與, 最新討論串1/1
小弟我目前桌電的配置 i7-6700 ASUS GTX970 Turbo RAM 16GB SSD 256GB/HDD 1TB 目前玩三A大作中規中矩 優化好的像是星際大戰,特效全開可以穩60 優化沒那麼好但也算不錯,像是梟雄/遠哭4 遊戲貼圖品質都可以開到最高 但像環境光遮蔽和反鋸齒就很明顯吃力 尤其是反鋸齒,都只能停在最基礎的FXAA才能全程穩60禎 優化差的像是量子裂痕或是之前古墓崛起一開始版本,禎數就很慘,很多項目都要調低才能 穩60 曾經把反鋸齒都調到最高,樹叢毛髮真的很逼真,但970就會變幻燈片XD 請問一下,像是反鋸齒要能開高禎數又要穩定,靠的是什麼呢? 顯卡的RAM嗎? 還是頻寬? 還是製程? 就目前看到的消息GTX 1080/1070還是沒有導入HMB,頂多就是RAM變大,然後製程變成16nm 這樣子的硬體提昇會有顯著的差異嗎? 還是說要等到明年真正導入HMB才有機會達到所謂的1080p特效反鋸齒全開穩60? 當然一切還是要等到正式發布甚至上市後憑測才能知道結論 但想請教一下,"反鋸齒""環境光遮蔽"要能開高,關鍵是在什麼部分呢? 謝謝 -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 61.230.44.192 ※ 文章網址: https://www.ptt.cc/bbs/VideoCard/M.1461580219.A.23E.html ※ 編輯: jakechen1027 (61.230.44.192), 04/25/2016 18:32:47

04/25 19:31, , 1F
HMB?
04/25 19:31, 1F

04/25 20:05, , 2F
主要取決於ROP效能 ROP效能則受到VRAM頻寬影響 當然GPU架構
04/25 20:05, 2F

04/25 20:06, , 3F
也會影響ROP效能 像Maxwell對比Kepler架構 同樣的VRAM頻寬下
04/25 20:06, 3F

04/25 20:07, , 4F
Maxwell的ROP效能更高 當然 VRAM頻寬還是愈大愈好 所以才會
04/25 20:07, 4F

04/25 20:08, , 5F
發展出HBM這類技術
04/25 20:08, 5F

04/25 20:56, , 6F
關鍵是“新臺幣”
04/25 20:56, 6F

04/25 21:22, , 7F
FXAA 其實只是畫面後處理,不像其他 AA 要算出更多sample
04/25 21:22, 7F

04/25 21:50, , 8F
你講了三個有點小關聯的.結果卻忽略最重要的是晶片本身
04/25 21:50, 8F

04/25 21:50, , 9F
就真的網友講的:show me the money
04/25 21:50, 9F

04/25 21:56, , 10F
從晶片角度來說就是端看晶片規格配置的ROP數目 以970來說是
04/25 21:56, 10F

04/25 21:58, , 11F
配置了56個ROP 兒980Ti則有96個ROP ROP效能對3D成像速率影響
04/25 21:58, 11F

04/25 21:58, , 12F
非常大
04/25 21:58, 12F


04/25 22:06, , 14F
簡單說 ROP單元負責GPU在3D成像過程中的最後一個輸出步驟
04/25 22:06, 14F

04/25 22:07, , 15F
有興趣可參考這篇對岸的文章 http://goo.gl/jdTH9x
04/25 22:07, 15F

04/25 22:09, , 16F
以750Ti和950來說 750Ti只有16個ROP 950則保留了32個ROP
04/25 22:09, 16F

04/25 22:11, , 17F
所以雖然950只比750Ti多出一組SMM(128SP) 但實際效能卻差距
04/25 22:11, 17F

04/25 22:12, , 18F
達到30% 可見ROP數目對成像效率影響是很大的 但這也相對需要
04/25 22:12, 18F

04/25 22:13, , 19F
GPU晶片上增加更多的電晶體 所以就如上面網友說的 拿愈多錢
04/25 22:13, 19F

04/25 22:13, , 20F
出來,就給你愈好的晶片規格
04/25 22:13, 20F

04/25 22:59, , 21F
其實就SP數目來比的話950多出約20% 950時脈頻寬也高
04/25 22:59, 21F

04/25 23:00, , 22F
VOP能有多大值得商榷(顯卡效能大致正比於SP數目)
04/25 23:00, 22F

04/25 23:00, , 23F
^影響
04/25 23:00, 23F

04/25 23:18, , 24F
如果了解繪圖晶片即時3D成像的過程 就不會認為ROP單元的效能
04/25 23:18, 24F

04/25 23:19, , 25F
(數目)不重要了 流處理器數量多也要批配夠多的ROP數來輸出
04/25 23:19, 25F

04/25 23:21, , 26F
原po提到的反鋸齒處理 通常是在ROP階段進行取樣處理
04/25 23:21, 26F

04/26 01:01, , 27F
我沒有說沒影響啊 但是重要的不是只有他
04/26 01:01, 27F

04/26 01:01, , 28F
更何況拿來比較的750Ti/950對前面運算的能力就有限 ROP
04/26 01:01, 28F

04/26 01:02, , 29F
比較強能看出的差異也是有限
04/26 01:02, 29F

04/26 04:33, , 30F
為何會拿750Ti和950是因為我覺得這例子有趣 因為就帳面SP數
04/26 04:33, 30F

04/26 04:34, , 31F
只差了128個也就是1.2倍 但實際效能可以差距到30多% 這原因
04/26 04:34, 31F

04/26 04:35, , 32F
我認為是750Ti的VRAM頻寬給得太少 以及ROP數砍半 雖然NV有宣
04/26 04:35, 32F

04/26 04:35, , 33F
稱Maxwell對於VRAM頻寬的需求可以降低(新的材質壓縮技術)
04/26 04:35, 33F

04/26 04:41, , 34F
但750Ti的VRAM頻寬只給到86.4GB/s是偏低的 如能給到和100多
04/26 04:41, 34F

04/26 04:44, , 35F
GB/s 相信750Ti的表現會比現在好不少 當然一顆GPU最重要的
04/26 04:44, 35F

04/26 04:45, , 36F
是流處理器數量 這決定整顆GPU的處理效能 但ROP單元的數目
04/26 04:45, 36F

04/26 04:47, , 37F
也必須夠多 才能完整發揮GPU的能力 所以目前在看GPU規格時
04/26 04:47, 37F

04/26 04:49, , 38F
會把SP/TMU/ROP三者規格都列出 另外原po問的反鋸齒處理
04/26 04:49, 38F

04/26 04:50, , 39F
通常是在ROP階段進行取樣處理 也就是3D成像的最後一個階段
04/26 04:50, 39F

04/26 04:51, , 40F
反正商人在商言商 錢拿得出愈多來 他就給你愈好晶片規格(笑)
04/26 04:51, 40F

04/26 08:18, , 41F
還是覺得t大最後一句話是正解
04/26 08:18, 41F
文章代碼(AID): #1N7V6x8- (VideoCard)
文章代碼(AID): #1N7V6x8- (VideoCard)