[請益] 10萬級別單卡跑通DeepSeek V4-Pro已刪文
藉著AI,我意淫出一張算力卡,推估終端售價低於十萬新台幣
可以單卡運行DeepSeek V4-Pro / 1M context
不確定來自AI幻覺的成分有多高,還請大神指正,細節如下:
核心: NPU + 96GB HBM4/4e + 1TB HBF (High Bandwidth Flash)
使用chiplet架構,並全面支援UCIe協議 (Universal Chiplet Interconnect express)
LLM參數全部存在HBF中,並將HBF的資料路徑直接對準NPU的矩陣運算單元
推理時,NPU直接從HBF讀取模型參數,HBM只負責KV Cache及其他
若進一步限制HBF在推理計算時是「唯讀」,可提高讀取穩定性、降低延遲、延長壽命
百萬上下文當然還是得靠DeepSeek CSA/HCA, Google TurboQuant等技術
受限於HBM 96GB空間,約可支援4-6個併發任務
限制整卡功耗在300W以下,推估有35TPS
價格推估如下:
(1)民主供應鏈
NPU $280 (TSMC N3P/N2)
96GB HBM4 $680 (SK Hynix / Micron)
1TB HBF $220 (WD / Kioxia)
先進封裝 $280 (TSMC CoWoS / Intel EMIB)
PCB/VRM/散熱 $130 (旗艦級件)
研發分攤 $600 (含 CUDA 兼容軟體層開發)
營銷與通路 $300
預期利潤(20%) $500
建議售價(MSRP) $2,999 USD (約台幣 9.6 萬)
(2)非民主供應鏈
NPU $380 (SMIC N+3/N+4) (光刻機限制,良率較低導致單顆成本較高)
96GB HBM4 $850 (長鑫存儲 CXMT) (產能稀缺且仍處於良率爬坡期,存在溢價)
1TB HBF $160 (長江存儲 YMTC) (YMTC在閃存成本具絕對優勢,且技術領先)
先進封裝 $220 (長電科技 XDFOI)
PCB/VRM/散熱 $100 (在地化供應)
研發分攤 $400 (政府專案補貼資助)
政府退稅/補貼 -$500 (針對關鍵硬體製造)
預期利潤(10%) $160
建議售價(MSRP) $1,799 USD (約台幣 5.8 萬)
不知技術上/規格上是否可行、散熱又是否可行? (AI說風冷就可以囉)
此外,降低規格,目標是可以跑通Qwen3.6 27B Dense模型
則可大幅降低售價,是不是更實在可行?
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 180.177.3.117 (臺灣)
※ 文章網址: https://www.ptt.cc/bbs/hardware/M.1777973422.A.8B3.html
→
05/05 17:58,
1小時前
, 1F
05/05 17:58, 1F
hardware 近期熱門文章
PTT數位生活區 即時熱門文章
-10
17