Re: [情報] 假的!NVIDIA 3060 算力限制被破解了

看板PC_Shopping (個人電腦購買)作者 (BL2400PT真不錯)時間3年前 (2021/03/16 00:21), 3年前編輯推噓13(13069)
留言82則, 11人參與, 3年前最新討論串10/12 (看更多)
※ 引述《tint (璇月)》之銘言: : 隨著消息的傳播 : 目前有愈來愈多的相關測試結果 : 根據Reddit和Gguru3D網站上一些討論的留言歸納: : 1.不限定微星的RTX3060 : 各廠牌RTX3060搭配470.05BETA驅動 之前比較少回文 不過原本就站在這東西遲早能破的那邊 因為對3060算力減半這件事情 實際上是在系列硬體已經出了一段時間才有的 所以應該不是在bios端鎖而是在driver端鎖 鎖的方法可能是compile針對特定的指令增加nop/latency, 或者是在這款硬體CL/CUDA啟動的時候寫入特定的setting register能影響速度 這件事情在driver內就像 我有一個門 原本前一陣子上市的硬體 拿了200-233號的磁卡 而今天開始發234號以後的卡 可是這些卡只能走新開的繞比較遠的門.打不開舊的門 破解的方法不是想辦法仿造出233號以前的卡, 只要門本身拆得掉你不能仿造卡本身就不會是問題 畢竟像SLI需要主機板支援這點最後也是破解了 不過假如沒有這次的出包,就是需要從driver 端逆向去找甚麼地方在檢查"大部分Ampere卡都用 而只有3060不能用" 的路徑 這個行為雖然在driver裡不過大概還是在user mode下可以追 但原本獨立找這個所花的時間不知道多少 今天這個driver 出現後,除非硬體有重新更改後再tapeout...不然新出的硬體和已有的晶片 屬於相同系列就等於再也鎖不住 實際上跑出這份driver可能也不是陰謀論 因為這種正常功能完成後才叫開發者在釋出日前新增/封鎖功能的 偶有這種情況....... 例如各模組以為都有對應的#ifdef但是整合起來build就是在某些模組沒有套用到 或者是開發者自己改來測舊code沒有廢掉不能用就上傳了 -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 1.169.246.243 (臺灣) ※ 文章網址: https://www.ptt.cc/bbs/PC_Shopping/M.1615825278.A.F0D.html

03/16 00:26, 3年前 , 1F
之前推測它實作方式可能是透過VRAM位寬減半剩96bit
03/16 00:26, 1F

03/16 00:27, 3年前 , 2F
因為算力限制時 VRAM溫度相比沒限制時低一些
03/16 00:27, 2F
傾向認定不是 因為現在也有遊戲混用gpgpu 一但修改頻寬它也很慘... 不過可能是改特定指令/l2/store等 的延遲 改長等於單位時間內讀寫也變少 當然比較涼一點

03/16 00:29, 3年前 , 3F
怕影響到某些遊戲,所以頻寬減半最安全,全鎖可能影
03/16 00:29, 3F

03/16 00:29, 3年前 , 4F
響到某些遊戲的體驗
03/16 00:29, 4F
遊戲沒頻寬也慘

03/16 00:29, 3年前 , 5F
這種可以破,那Quadro是怎麼鎖?還是也破了87趴?
03/16 00:29, 5F

03/16 00:29, 3年前 , 6F
或者是硬體底層降低VRAM的供電/時脈
03/16 00:29, 6F

03/16 00:30, 3年前 , 7F
沒有破解啊 只是閃過限制而已
03/16 00:30, 7F

03/16 00:32, 3年前 , 8F
3060現在靠BETA驅動繞過去了,quadro有類似情形嗎?
03/16 00:32, 8F
unified driver時不管n或者a都有 某版driver跑gl專業軟體速度暴增 只是不知有意或者意外

03/16 00:32, 3年前 , 9F
就剛好Beta驅動沒有完全限制
03/16 00:32, 9F

03/16 00:33, 3年前 , 10F
不然差不多規格貴那麼多,怎麼賣?
03/16 00:33, 10F

03/16 00:34, 3年前 , 11F
Quadro驅動跟GeForce 分家很久了
03/16 00:34, 11F

03/16 00:35, 3年前 , 12F
老黃出這一手3060要賣翻了
03/16 00:35, 12F

03/16 00:35, 3年前 , 13F
不過看討論區 有些人的3060搭配這BETA版驅動
03/16 00:35, 13F

03/16 00:36, 3年前 , 14F
ETH算力還是無法達到40MH/s以上
03/16 00:36, 14F

03/16 00:41, 3年前 , 15F
微星的3060是目前成功率100%的嗎?
03/16 00:41, 15F

03/16 00:42, 3年前 , 16F
猜測應該是要有足夠的PCIE通道吧,通道不夠就鎖算力
03/16 00:42, 16F

03/16 00:45, 3年前 , 17F
而且還必須要接顯示器
03/16 00:45, 17F

03/16 01:02, 3年前 , 18F
不,它並不是直接全面鎖顯示卡VRAM位寬
03/16 01:02, 18F
bit寬度是全體的狀態 會不全面嗎 而且你在3060上少了96bit也會有3gb讀不到 要是剩3gb還能解應該跟實際不符

03/16 01:03, 3年前 , 19F

03/16 01:04, 3年前 , 20F
這是之前測試降低ETH算力的影片 一開始它會以正常
03/16 01:04, 20F

03/16 01:04, 3年前 , 21F
算力執行 但觸發了NV的反挖礦機制後 算力才降到一半
03/16 01:04, 21F

03/16 01:05, 3年前 , 22F
欣亞msi的3060都被掃了
03/16 01:05, 22F

03/16 01:07, 3年前 , 23F
但像其他KAWPOW和Octopus這些一樣佔用DAG且頻繁存取
03/16 01:07, 23F

03/16 01:07, 3年前 , 24F
VRAM的算法 卻完全沒有觸發反挖礦機制而降低算力
03/16 01:07, 24F

03/16 01:08, 3年前 , 25F
根據NV之前新聞稿 它說是僅針對ETHash算法去限制
03/16 01:08, 25F

03/16 01:09, 3年前 , 26F
https://tinyurl.com/2rf5b8m9 之前這一篇新聞
03/16 01:09, 26F

03/16 01:09, 3年前 , 27F
根本就不需要那麼多陰謀論,老黃能混到今日的名堂
03/16 01:09, 27F

03/16 01:09, 3年前 , 28F
RTX 3060 software drivers are designed to detect
03/16 01:09, 28F

03/16 01:09, 3年前 , 29F
絕對比你我、比板上任一個人都更間巧、更老奸巨猾(O
03/16 01:09, 29F

03/16 01:10, 3年前 , 30F
specific attributes of the Ethereum
03/16 01:10, 30F

03/16 01:10, 3年前 , 31F
你我想得到的,老黃有可能會想不到嗎?
03/16 01:10, 31F

03/16 01:10, 3年前 , 32F
玩家的錢老黃要賺,礦工的錢老黃當然也要賺
03/16 01:10, 32F

03/16 01:10, 3年前 , 33F
cryptocurrency mining algorithm, and limit
03/16 01:10, 33F

03/16 01:10, 3年前 , 34F
所以老黃要推礦卡,只要礦工買礦卡老黃就能賺更多錢
03/16 01:10, 34F

03/16 01:10, 3年前 , 35F
the hash rate, or cryptocurrency mining
03/16 01:10, 35F

03/16 01:10, 3年前 , 36F
想想為什麼會有新beta驅動?啊不就3080Ti快要出來了
03/16 01:10, 36F

03/16 01:10, 3年前 , 37F
efficiency, by around 50 percent.
03/16 01:10, 37F

03/16 01:11, 3年前 , 38F
今天只鎖ETH算法,但以後呢?想要礦工願意去買礦卡
03/16 01:11, 38F

03/16 01:11, 3年前 , 39F
那遊戲卡對挖礦的限制設計就要越來越嚴格
03/16 01:11, 39F

03/16 01:11, 3年前 , 40F
但算法鎖越大,沒人能保證以後遊戲效能不會被砍到
03/16 01:11, 40F

03/16 01:11, 3年前 , 41F
NV聲明很明確說只限制Ethereum mining algorithm
03/16 01:11, 41F

03/16 01:11, 3年前 , 42F
所以這新beta驅動會特別針對挖礦限制做這樣的設計
03/16 01:11, 42F

03/16 01:12, 3年前 , 43F
大概就為了之後的3080Ti、和之後尚未出世的顯卡鋪路
03/16 01:12, 43F

03/16 01:12, 3年前 , 44F
其他挖礦算法不防 這樣很可能就是針對特定計算指令
03/16 01:12, 44F

03/16 01:12, 3年前 , 45F
反正遊戲玩家買顯卡玩遊戲,當然都插x16或x8
03/16 01:12, 45F

03/16 01:12, 3年前 , 46F
那以後的驅動對算法限制再大,也不會砍到玩家效能
03/16 01:12, 46F

03/16 01:13, 3年前 , 47F
ETHash算法來說 會使用到SHA-256和SHA-512雜湊函數
03/16 01:13, 47F

03/16 01:13, 3年前 , 48F
它可能就是針對特定計算指令去觸發反挖礦機制
03/16 01:13, 48F

03/16 01:14, 3年前 , 49F
一般遊戲用途、通用運算 並沒有觸發反挖礦機制
03/16 01:14, 49F

03/16 01:14, 3年前 , 50F
所以也就沒有VRAM位寬被限制的問題了
03/16 01:14, 50F

03/16 01:21, 3年前 , 51F
在沒觸發反挖礦機制前 3060硬體運作值應是完全正常
03/16 01:21, 51F

03/16 01:32, 3年前 , 52F
如果它驅動程式端會針對特定的指令增加nop/latency
03/16 01:32, 52F

03/16 01:33, 3年前 , 53F
那麼應不會看到一開始約30秒時間是正常ETH算力
03/16 01:33, 53F
這就是對gpgpu環境不夠理解了 它隨時都可以recompile 事實上n和a的環境使用clcompile 得到的東西並不是直接給硬體執行 到最後clenqueuendrangekernel之內(這會持續執行無數次) 還會再針對硬體轉譯(用cuda的話原理相同不贅述) 開頭和後期跑的內容自然可以效能不一樣 當然我沒前面說法都沒否定用硬體設定影響的可能性

03/16 01:35, 3年前 , 54F
可見它可能是偵測特定計算指令才觸發了反挖礦機制
03/16 01:35, 54F

03/16 01:44, 3年前 , 55F
之前有外國網友測試讓3060同時挖ETH和CFX幣
03/16 01:44, 55F

03/16 01:44, 3年前 , 56F
就是同時跑ETHash和Octopus二種算法
03/16 01:44, 56F

03/16 01:45, 3年前 , 57F
3060在單獨跑Octopus算法時 算力是正常的45MH/s
03/16 01:45, 57F

03/16 01:46, 3年前 , 58F
但是二種同時跑 Octopus算法的算力也跟著出現大幅
03/16 01:46, 58F

03/16 01:46, 3年前 , 59F
滑落到一半以下的現象
03/16 01:46, 59F
※ 編輯: jk21234 (1.169.246.243 臺灣), 03/16/2021 02:14:50

03/16 09:00, 3年前 , 60F
講那麼多 破解了沒?
03/16 09:00, 60F

03/16 12:32, 3年前 , 61F
就沒破啊,新卡出來防堵一下繼續鎖CC
03/16 12:32, 61F

03/16 15:02, 3年前 , 62F
還有一個方法,cuda thread自動減半。
03/16 15:02, 62F

03/16 17:56, 3年前 , 63F
我認為它如果compile針對特定的指令增加nop/latency
03/16 17:56, 63F

03/16 17:57, 3年前 , 64F
在挖ETH時會直接就呈現減半的算力 而不會一開始先
03/16 17:57, 64F

03/16 17:58, 3年前 , 65F
跑出正常的算力一段時間 之後才快速下降至減半值
03/16 17:58, 65F

03/16 17:59, 3年前 , 66F
這個情況會像是顯示卡硬體運作數值在調降造成的
03/16 17:59, 66F

03/16 18:00, 3年前 , 67F
就像如果你在挖ETH途中 去突然即時拉低PL或VRAM頻率
03/16 18:00, 67F

03/16 18:01, 3年前 , 68F
它的算力會呈現類似的下降狀態
03/16 18:01, 68F

03/16 18:04, 3年前 , 69F
另外 3060規格是12GB 單顆2GB共6顆組成192bit
03/16 18:04, 69F

03/16 18:05, 3年前 , 70F
我意思是如果它96bit時是從IMC控制通道數下降一半
03/16 18:05, 70F

03/16 18:06, 3年前 , 71F
但要觸發反挖礦機制時才會發生 平常各應用時都正常
03/16 18:06, 71F

03/16 18:07, 3年前 , 72F
我還是傾向認為它是觸發反挖礦機制時 才會調降顯卡
03/16 18:07, 72F

03/16 18:09, 3年前 , 73F
的特定硬體運作數值 而不是直接就針對特定的指令去
03/16 18:09, 73F

03/16 18:09, 3年前 , 74F
增加nop/latency 這樣影響的層面較大
03/16 18:09, 74F

03/16 18:11, 3年前 , 75F
顯卡運作上分為正常狀態和觸發反挖礦模式二種狀態
03/16 18:11, 75F

03/16 18:11, 3年前 , 76F
這樣影響層面會較小
03/16 18:11, 76F

03/16 18:19, 3年前 , 77F
是啊,調整thread也是大概同樣效果,scheduler慢慢
03/16 18:19, 77F

03/16 18:20, 3年前 , 78F
的減少thread。但實際如何,只有N知道
03/16 18:20, 78F

03/16 18:22, 3年前 , 79F
減少thread方式的話 這樣就也能說明存在二種模式
03/16 18:22, 79F

03/16 18:24, 3年前 , 80F
因為像ProgPow、KawPow、Octopus這些吃重核心運算的
03/16 18:24, 80F

03/16 18:26, 3年前 , 81F
挖礦算法完全沒影響算力 目前已知受影響的挖礦算法
03/16 18:26, 81F

03/16 18:27, 3年前 , 82F
有ETHash和Verthash 這二種算法都會呈現算力減半
03/16 18:27, 82F
文章代碼(AID): #1WJub-yD (PC_Shopping)
討論串 (同標題文章)
文章代碼(AID): #1WJub-yD (PC_Shopping)