[心得] ComfyUI RX 9070XT便攜包分享
ComfyUI for AMD RX 9070XT便攜包更新
ComfyUI_Win_portable_RX9070 TRFv0.3-Lite
https://drive.google.com/file/d/1PasVAW889I1uzwtDBcWIP3IoeC-aIogi/view?usp=sharing
更新的軌跡
https://forum.gamer.com.tw/C.php?page=1&bsn=60030&snA=679332&gothis=2554285#2554285
ComfyUI更新到 0.25.0
第一次使用請先點擊Update ROCm.bat
安裝ROCm 與 PyTorch
https://i.imgur.com/Mcndnz5.png

選擇 1. 多架構 ROCm 與 PyTorch (gfx1201)
即可安裝最新版本ROCm/TheRock
安裝完可以選擇
4. 清除 UV 套件快取
接著點擊Start.bat會開始載入ComfyUI
跑完後將 http://127.0.0.1:8188 貼到瀏覽器啟動ComfyUI
1.此版本改用 SageAttention 2.2.0
https://github.com/thu-ml/SageAttention/pull/368
這是AMD的工程師jammm
針對RDNA4架構的特殊版本
QK 使用 int8 WMMA,對 PV 使用 fp8 WMMA
使用C++ 配合 AMD 的 HIP 框架來編寫底層 Kernel
最近的更新還支援了head_dim 256
https://github.com/thu-ml/SageAttention/pull/368
https://i.imgur.com/CNynjM0.png

WAN2.2 480X832 81幀 57.45秒
https://i.imgur.com/ACDjIAi.png

WAN2.2 720X1088 81幀 153.03秒
https://i.imgur.com/TOzyPck.png

WAN2.2 720X1280 81幀 199.5秒
https://i.imgur.com/UeTNIMz.png

Z-image-turbo 1024*1204 6步 4.15秒
2.Flash_attn-2.8.4 RDNA4 CK(Composable Kernel 後端)支持
有些情況跑圖如果想要更高的精度
或者SageAttention出問題的情況
可以考慮換用Flash Attention
基本上SageAttention 2.2.0
RDNA4特化的版本速度是全面提升
PyTorch Version: 2.12.0+rocm7.14.0a20260620
ROCm Version (from PyTorch): 7.14.60850
https://i.imgur.com/04OiC7Z.png


安裝好ROCm
點擊Start.bat啟動
https://i.imgur.com/dDXDxuL.png

步驟1~3建議選擇1即可
步驟 4: 選擇 VRAM 模式
https://i.imgur.com/z8NfqnK.png

系統記憶體比較小者
可以選擇2. 開啟動態 VRAM (--enable-dynamic-vram)
ComfyUI 0.25.0 多了很多自定義參數
動態顯存管理
舊的
-reserve-vram [GB]:手動預留一部分顯存(單位 GB)給操作系統或其它軟件,防
止 ComfyUI 把VRAM全部吃光導致系統卡死。
新的
-vram-headroom [GB]:為動態顯存(DynamicVRAM)設置額外的安全緩沖空間。
ComfyUI 會盡量保持這部分VRAM完全空閒。
節點的緩存管理參數
-cache-ram:【默認模式】基於系統RAM壓力進行緩存。可傳入 1 或 2 個值(如
--cache-ram 4 2),分別代表活動緩存和非活動緩存的RAM保留閾值。
-cache-classic:使用舊版的激進緩存機制(只要RAM夠就拼命緩存)。
-cache-none:完全不緩存任何中間結果。每次點生成,所有節點全部重新執行。極度
省VRAM/RAM,但連續生成速度會變慢。
-high-ram:高性能內存模式,如果系統內存極大或者比起頻繁加載模型更願意吃虛擬
RAM,開啟此項可微幅提升性能(內部會激活經典緩存)。
-fast-disk:當VRAM不夠時,優先把模型緩存到高速SSD(如 NVME SSD)上,而不是
系統RAM。
上面參數有其相關性
--high-ram與--fast-disk兩個互相沖突
一個是積極使用系統RAM
一個是優先使用硬碟當緩存
用--high-ram會強制連動使用--cache-classic模式
--cache-ram與--high-ram也沖突
因為會強制用--cache-classic
我做了一些調整讓這功能在A卡上穩定一些
許多變數與參數都寫在Start.bat裡面
https://i.imgur.com/W9YFMMf.png

預設我是使用--high-ram --vram-headroom 2
系統記憶體較小者可以嘗試
-fast-disk --vram-headroom 2
甚至
-fast-disk --cache-none --vram-headroom 2
步驟 5: 選擇智慧記憶體模式
單純跑圖 選擇1. 預設模式會比較快
如果要跑Wan2.2或LTX-2.3
選擇2. 關閉智慧記憶體 (--disable-smart-memory)會比較穩定
裡面內建了一些工作流
也可以從ComfyUI內建的工作流開始學起
目前ComfyUI壓根不想對GGUF量化做優化支持
動態顯存也不支持GGUF量化
建議模型都用FP8
我這裡提供一些基礎模型
https://drive.google.com/drive/folders/1A9YgUdtGQiTltQTz-kJxdR6A323ihS6Y
civitai也都抓的到
https://civitai.red/?sync-account=green
ComfyUI目前建議不要隨便更新
他們常常想幹嘛就幹嘛
常常破壞性更新
除非你有自行除錯的能力
就算你用N卡也有可能一更新就發現怎麼性能下降
甚至工作流直接報錯
非RDNA4架構的使用者
可以嘗試使用這個版本
bilibili.com/video/BV1LijF6iE8J/?spm_id_from=333.1387.list.card_archive.click
這個UP主我在QQ群有跟他交流分享
他本身是7900XT的用戶
基本上理念是不賣課免費分享
我將優化過的SageAttention1 Triton分享給他
跟怎麼調整參數也一併說明
讓7900XTX基本上提速30~40%
算是造福不少老卡用戶
https://www.bilibili.com/video/BV1PjEW6sEfD/?share_source=copy_web&vd_source=eb2d0f76cdb7d14c8bb995ec40576315
他比較傾向照顧所有A卡使用者
RDNA1~4全部支持跑ComfyUI
甚至照顧一群小白把屎把尿的
更新就沒有我的便攜包激進
我只單獨針對RDNA4調整比較沒包袱
我實在沒什麼耐心面對那麼多小白
不過也能去看他影片學習工作流怎麼使用
他都是跟A卡做試配的
最後一些圖片分享
https://i.imgur.com/mTsLAzH.jpeg







ANIMA基本上只要你想
怎麼玩都可以
https://i.imgur.com/jHPklY8.jpeg

多角色PLAY也不是問題
ROCm這半年加強舊卡支援
https://i.imgur.com/WHWnnao.png

也算是戰未來?
即將ROCm迎來8.0
AMD下半年如何
等7/22 Advancing Al 2026吧
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 125.229.59.186 (臺灣)
※ 文章網址: https://www.ptt.cc/bbs/PC_Shopping/M.1782047488.A.7C9.html
PC_Shopping 近期熱門文章
12
109
PTT數位生活區 即時熱門文章