Re: [閒聊] 有沒有L1 L2成本的八卦

看板PC_Shopping (個人電腦購買)作者 ( )時間15年前 (2009/10/01 23:42), 編輯推噓79(790296)
留言375則, 28人參與, 最新討論串1/1
※ 引述《herculex (漂流木)》之銘言: : 唔...這是認真的 : 看到GT300中出現L1 L2這是不是意味著GT300設計越來越像CPU : 只不過印象中L1成本很高 L2成本稍低 : 不曉得這樣的認知有沒有錯 : GT220據說是以GT200架構為基礎,那是不是在中低階上這樣的方案就不容易延用? : GT300上有16組Streaming Multiprocessor 每組SM有16KB的L1 768KB的L2 : 所以總計有256KB的L1 12MB的L2 這樣算沒錯吧@@ : 這樣的架構在產品定位的延伸性會不會受影響 GT200/G9x/G8x 每個SMp(Block)中含有16KB的....... Local Memory (O) Embedded Memory (O) Cache (X) Software Cache(片笑...) GT300則進一步擴展成64KB,可以有兩種組態的 Scratchpad Memory (O) Scratchpad cache (O) cache (X) 應該說每個SMp底下有64KB,可以16KB cache,48KB手動控制的記憶體. 或者是48KB cache,16KB手動控制的記憶體. 其中之所以不能全部當cache用,可能是為了保障相容性. 否則無法執行以往G80/GT200的舊程式.....這部分其實還很不明確. 兩者都是在晶片內部,以高速SRAM實作的記憶體.不過 scratchpad memory和cache的差別則在於: 1. cache是自動操作 ,sratchpad memory要讀寫甚麼資料都是由程式手動 2. cache的好處在於才剛讀寫過的資料保存,但是在比如streaming資料的場合. 比如說影音資料等持續送來,每個只使用一次等.cache就沒有甚麼好處. 這時候能手動預先讀入的scratchpad memory才有優勢. 至於RV870也具有scratchpad memory或者是embedded memory. (並非只有GPGPU需要.所以很顯然更早以前的DX10晶片也有只是資料不明) 只是對於cache的部分則不明..... ============================= 寫一下範例好了.假設系統有32MB主記憶體.64KB cache或者是scratchpad memory 外部記憶體存取時間100 cycle,cache/SPM存取 3 cycle. scratchpad memory的場合: 定址空間中,有64KB必須被劃定為SPM(scatchpad memory的縮寫)佔用, 在CPU中,邏輯上可以用的記憶體容量是定址空間,但是並非都是真的可以用的記憶體, 有些會被保留住,有些被當其他用途...... 0--------128KB-------192KB------1MB------------33MB SPM Main Memory 這時候,CPU的指令如果要使用較快的SPM,就必須 讀寫128~192KB這個區段.而且也比主記憶體快很多. 所以一般而言,會先把初始資料由Main Memory區段搬入128-192這個範圍. 然後計算的過程會儘量讀寫這塊區域..最後算完了,再把結果由128-192中間 搬出來.複製回主記憶體. 這時候,讀寫SPM以及Main Memory區段不但是沒相關的兩塊,而且 Main Memory不管同一個位址連續讀幾次.都要花同樣久的時間. 如果是cache的話,cpu指令就只看的見&操作 Main Memory的32MB, 可是有一個看不見的cache在背後運作,它會保留前幾次Memory讀寫的內容, 只要用的是同樣的位址,就會直接自cache中取出(cache hit).而取得較快 的速度.如果不存在於cache中的話(cache miss),就仍然自主記憶體中讀取, 並且複製一份放在cache中等待下次用到....cache的說明我比較省略是因為 對pc玩家來說應該對cache不陌生才對. -- ※ 發信站: 批踢踢實業坊(ptt.cc) ◆ From: 140.114.78.62

10/01 23:42, , 1F
10/01 23:42, 1F

10/01 23:43, , 2F
不過對於即將到來的推文我感到哀傷
10/01 23:43, 2F

10/01 23:44, , 3F
首推
10/01 23:44, 3F

10/01 23:44, , 4F
推推推
10/01 23:44, 4F

10/01 23:45, , 5F
看不是很懂..= =
10/01 23:45, 5F

10/01 23:46, , 6F
scratchpad memory和cache和register 只有一個功能~~
10/01 23:46, 6F

10/01 23:46, , 7F
所以 要取代CPU還是要WINDOWS配合吧 科科
10/01 23:46, 7F

10/01 23:46, , 8F
儲存資料~~~~~~~~~~~作為儲存單元使用~~~~~
10/01 23:46, 8F
問題是速度,register隨時都可以用.沒有延遲. cache或者是scratchpad memory可能有1~3個cycle, DRAM memory可能在100個cycle以上.

10/01 23:46, , 9F
突然 M$猛烈地 收購NVIDIA
10/01 23:46, 9F

10/01 23:47, , 10F
我哀傷了
10/01 23:47, 10F

10/01 23:47, , 11F
非常憂傷
10/01 23:47, 11F

10/01 23:47, , 12F
總而言之就是各有優劣X|D...
10/01 23:47, 12F
※ 編輯: jk21234 來自: 140.114.78.62 (10/02 00:02)

10/01 23:48, , 13F
好好的一篇知識文...
10/01 23:48, 13F

10/01 23:48, , 14F
我看他白皮書寫得 好像是GT200以前的暫存是唯獨
10/01 23:48, 14F
那部分是使用GPU舊有的"texture cache"機制. GPU很早以前就擁有少量cache,但是並沒有被太大著墨. 原因很明顯,因為圖像資料有很大的量是不會被重複用到的. 但是貼圖是另外一個問題,同一個貼圖可能被用在很多區域很多三角面上. 所以texture cache可以派上用場,但是也只要能讀就好了.

10/01 23:48, , 15F
推文開始要憂傷了
10/01 23:48, 15F

10/01 23:48, , 16F
NV想用GPU把CPU的地位壓到最小 INTEL把GPU整合進去CPU
10/01 23:48, 16F

10/01 23:48, , 17F
GT300可多次讀寫 感覺很怪就是
10/01 23:48, 17F
原因很簡單啊,你沒辦法做一個又大又快又可以共享不會打架的記憶體架構. 只好切出trade-off最小的做法. 如果你需要寫一個1024x1024的矩陣運算,裡面的資料就一定不夠用了. (至少要好幾MB,1024x1024x每筆資料長度) 這時候..... a.給你16~64KB的小型快速記憶體,自己切割程式成塞得進去. b.不管它,直接照直覺寫,這時候你需要做存取緩慢的主記憶體 約一百萬次.每次100個cycle c.邏輯上直接寫,但是有cache幫你節省時間增進效率. 這個例子聽起來cache比較好對嗎 ?? 不過,如果換成你要把一個圖案壓縮成jpeg/mpeg,可能就相反了. 因為最重要的是把所有的像素,以8x8或者是16x16一組分割,然後分別進行破壞性壓縮 這時候,每組資料也只會用到一次,因此cache的效果就不如手動控制了.

10/01 23:49, , 18F
把我的悲傷~~留給自己~~
10/01 23:49, 18F

10/01 23:49, , 19F
不過似乎後者的力量最大
10/01 23:49, 19F

10/01 23:49, , 20F
GPU要搞成通用 需要大量軟體商配合
10/01 23:49, 20F

10/01 23:49, , 21F
說不定GT300塞個x86指令進去就變成拉拉比了XD
10/01 23:49, 21F

10/01 23:50, , 22F
名稱分成幾種不重要~~~~~重要的是儲存容量大小~~~
10/01 23:50, 22F

10/01 23:50, , 23F
INTEL把GPU整合進去 從軟體的觀點來看跟以前並無差別
10/01 23:50, 23F

10/01 23:50, , 24F
那作IC設計的人真是吃飽的閒著 通通叫做memory就好了
10/01 23:50, 24F

10/01 23:50, , 25F
GT300應該比較像RISC的東西吧@@
10/01 23:50, 25F

10/01 23:50, , 26F
可是現在也沒純RISC了
10/01 23:50, 26F
我的看法是跟這個無關,GT300的走向非常像DSP

10/01 23:51, , 27F
前者的優勢就是不需要軟體配合?
10/01 23:51, 27F

10/01 23:51, , 28F
RISC和CISC應該是二十年前的分法???
10/01 23:51, 28F

10/01 23:51, , 29F
而且嵌入X86指令 肯定被Intel告到翻掉
10/01 23:51, 29F
x86指令集是公共財.不過如果只要做mCU的話其實沒有非要用x86不可.

10/01 23:51, , 30F
肚子餓了 吃飯吃麵吃甘藷都是一樣的~~~通通是澱粉~~~
10/01 23:51, 30F

10/01 23:51, , 31F
GPU要搞成通用 軟體商一定要大力支援吧
10/01 23:51, 31F

10/01 23:52, , 32F
重點不是吃哪一種~~~~~~~~重點是吃多少大卡多少熱量~
10/01 23:52, 32F

10/01 23:52, , 33F
NV不就和M$一起研究怎麼讓GPU在WINDOWS裡加宿嗎 科科
10/01 23:52, 33F
還有 302 則推文
還有 4 段內文
10/02 00:47, , 336F
那戰場原呢[[[
10/02 00:47, 336F

10/02 00:48, , 337F
[[[[[[[[[[[[[[[[[[[[[[[[[[[[[[[[[[[[[[[[[[[[[[[[[[[[[[[[[
10/02 00:48, 337F

10/02 00:48, , 338F
有看有推。
10/02 00:48, 338F

10/02 00:48, , 339F
攻殼機動隊
10/02 00:48, 339F

10/02 00:49, , 340F
你脖子後面有PLUG嗎?
10/02 00:49, 340F

10/02 00:51, , 341F
我想某田米飯共生的應該走了 可以回歸正題 宵夜吃啥?
10/02 00:51, 341F

10/02 00:51, , 342F
我已經吃掉一包多力多滋了= =
10/02 00:51, 342F

10/02 00:51, , 343F
我剛剛吃了一盒可口奶酥
10/02 00:51, 343F

10/02 00:52, , 344F
我要睡覺了(倒 看來光華附近真的沒有賣章魚燒...
10/02 00:52, 344F

10/02 00:52, , 345F
琣a板上還有一盒巧克力派
10/02 00:52, 345F

10/02 00:52, , 346F
我想吃滷味
10/02 00:52, 346F

10/02 00:53, , 347F
難怪瘦不下來~_~
10/02 00:53, 347F

10/02 00:53, , 348F
光華吃章魚腳比較好吃
10/02 00:53, 348F

10/02 00:53, , 349F
難怪受不下來
10/02 00:53, 349F

10/02 00:54, , 350F
光華要去吃 炸雞排
10/02 00:54, 350F

10/02 00:54, , 351F
想吃但未必要吃好嗎~_~
10/02 00:54, 351F

10/02 00:56, , 352F
看來真的得跑去東區或者師大才有章魚燒了...
10/02 00:56, 352F

10/02 00:56, , 353F
去找中醫開容易拉肚子的藥 ㄎㄎ
10/02 00:56, 353F

10/02 00:57, , 354F
日本人描寫的未來科技比美國人有趣多了
10/02 00:57, 354F

10/02 00:58, , 355F
茶花好像對減肥真的有用...
10/02 00:58, 355F

10/02 00:58, , 356F
吃不到嗎 ?
10/02 00:58, 356F

10/02 00:58, , 357F
花花 裡面有香料= =
10/02 00:58, 357F

10/02 00:59, , 358F
寶特瓶茶多少有香料吧
10/02 00:59, 358F

10/02 01:00, , 359F
買玫瑰花茶好了
10/02 01:00, 359F

10/02 01:00, , 360F
我愛每日C
10/02 01:00, 360F

10/02 01:01, , 361F
可以那麼簡單減肥世界上就沒胖子
10/02 01:01, 361F

10/02 01:01, , 362F
日本鎖國 207X的樣子
10/02 01:01, 362F

10/02 01:01, , 363F
喝有糖份的飲料就不行啦
10/02 01:01, 363F

10/02 01:01, , 364F
黑船阿阿阿
10/02 01:01, 364F

10/02 01:02, , 365F
coke light coke zero 無糖茶
10/02 01:02, 365F

10/02 01:03, , 366F
我都喝正常的COKE
10/02 01:03, 366F

10/02 01:03, , 367F
0木 明天要去好市多嗎
10/02 01:03, 367F

10/02 01:03, , 368F
我自己算過 無糖換無有糖 一天差一個便當的熱量...
10/02 01:03, 368F

10/02 01:03, , 369F
私下講
10/02 01:03, 369F

10/02 11:44, , 370F
那當年乾脆不要發展3d圖學 平民又用不到 ET4000大家爽爽用
10/02 11:44, 370F

10/02 11:44, , 371F
反正我玩軒轅劍二 創世紀7 魔獸二都沒用到3d的東西
10/02 11:44, 371F

10/02 12:22, , 372F
慾望是人類進步的動力 人類慾望無窮盡
10/02 12:22, 372F

10/02 12:51, , 373F
以前計組沒修好 XD
10/02 12:51, 373F

10/02 16:18, , 374F
這麼喜歡曲解別人意思阿 我沒說不要發展阿
10/02 16:18, 374F

10/02 16:19, , 375F
我好希望遊戲有用到通用計算 可以帶來大幅的好處
10/02 16:19, 375F
文章代碼(AID): #1AnCtaWg (PC_Shopping)
文章代碼(AID): #1AnCtaWg (PC_Shopping)