[心得] ComfyUI RX 9070XT便攜包分享

看板PC_Shopping (個人電腦購買)作者 (TRF小兵)時間1小時前 (2026/06/21 21:11), 編輯推噓0(000)
留言0則, 0人參與, 最新討論串1/1
ComfyUI for AMD RX 9070XT便攜包更新 ComfyUI_Win_portable_RX9070 TRFv0.3-Lite https://drive.google.com/file/d/1PasVAW889I1uzwtDBcWIP3IoeC-aIogi/view?usp=sharing 更新的軌跡 https://forum.gamer.com.tw/C.php?page=1&bsn=60030&snA=679332&gothis=2554285#2554285 ComfyUI更新到 0.25.0 第一次使用請先點擊Update ROCm.bat 安裝ROCm 與 PyTorch https://i.imgur.com/Mcndnz5.png
選擇 1. 多架構 ROCm 與 PyTorch (gfx1201) 即可安裝最新版本ROCm/TheRock 安裝完可以選擇 4. 清除 UV 套件快取 接著點擊Start.bat會開始載入ComfyUI 跑完後將 http://127.0.0.1:8188 貼到瀏覽器啟動ComfyUI 1.此版本改用 SageAttention 2.2.0 https://github.com/thu-ml/SageAttention/pull/368 這是AMD的工程師jammm 針對RDNA4架構的特殊版本 QK 使用 int8 WMMA,對 PV 使用 fp8 WMMA 使用C++ 配合 AMD 的 HIP 框架來編寫底層 Kernel 最近的更新還支援了head_dim 256 https://github.com/thu-ml/SageAttention/pull/368 https://i.imgur.com/CNynjM0.png
WAN2.2 480X832 81幀 57.45秒 https://i.imgur.com/ACDjIAi.png
WAN2.2 720X1088 81幀 153.03秒 https://i.imgur.com/TOzyPck.png
WAN2.2 720X1280 81幀 199.5秒 https://i.imgur.com/UeTNIMz.png
Z-image-turbo 1024*1204 6步 4.15秒 2.Flash_attn-2.8.4 RDNA4 CK(Composable Kernel 後端)支持 有些情況跑圖如果想要更高的精度 或者SageAttention出問題的情況 可以考慮換用Flash Attention 基本上SageAttention 2.2.0 RDNA4特化的版本速度是全面提升 PyTorch Version: 2.12.0+rocm7.14.0a20260620 ROCm Version (from PyTorch): 7.14.60850 https://i.imgur.com/04OiC7Z.png
https://i.imgur.com/YwJYmDQ.png
安裝好ROCm 點擊Start.bat啟動 https://i.imgur.com/dDXDxuL.png
步驟1~3建議選擇1即可 步驟 4: 選擇 VRAM 模式 https://i.imgur.com/z8NfqnK.png
系統記憶體比較小者 可以選擇2. 開啟動態 VRAM (--enable-dynamic-vram) ComfyUI 0.25.0 多了很多自定義參數 動態顯存管理 舊的 -reserve-vram [GB]:手動預留一部分顯存(單位 GB)給操作系統或其它軟件,防 止 ComfyUI 把VRAM全部吃光導致系統卡死。 新的 -vram-headroom [GB]:為動態顯存(DynamicVRAM)設置額外的安全緩沖空間。 ComfyUI 會盡量保持這部分VRAM完全空閒。 節點的緩存管理參數 -cache-ram:【默認模式】基於系統RAM壓力進行緩存。可傳入 1 或 2 個值(如 --cache-ram 4 2),分別代表活動緩存和非活動緩存的RAM保留閾值。 -cache-classic:使用舊版的激進緩存機制(只要RAM夠就拼命緩存)。 -cache-none:完全不緩存任何中間結果。每次點生成,所有節點全部重新執行。極度 省VRAM/RAM,但連續生成速度會變慢。 -high-ram:高性能內存模式,如果系統內存極大或者比起頻繁加載模型更願意吃虛擬 RAM,開啟此項可微幅提升性能(內部會激活經典緩存)。 -fast-disk:當VRAM不夠時,優先把模型緩存到高速SSD(如 NVME SSD)上,而不是 系統RAM。 上面參數有其相關性 --high-ram與--fast-disk兩個互相沖突 一個是積極使用系統RAM 一個是優先使用硬碟當緩存 用--high-ram會強制連動使用--cache-classic模式 --cache-ram與--high-ram也沖突 因為會強制用--cache-classic 我做了一些調整讓這功能在A卡上穩定一些 許多變數與參數都寫在Start.bat裡面 https://i.imgur.com/W9YFMMf.png
預設我是使用--high-ram --vram-headroom 2 系統記憶體較小者可以嘗試 -fast-disk --vram-headroom 2 甚至 -fast-disk --cache-none --vram-headroom 2 步驟 5: 選擇智慧記憶體模式 單純跑圖 選擇1. 預設模式會比較快 如果要跑Wan2.2或LTX-2.3 選擇2. 關閉智慧記憶體 (--disable-smart-memory)會比較穩定 裡面內建了一些工作流 也可以從ComfyUI內建的工作流開始學起 目前ComfyUI壓根不想對GGUF量化做優化支持 動態顯存也不支持GGUF量化 建議模型都用FP8 我這裡提供一些基礎模型 https://drive.google.com/drive/folders/1A9YgUdtGQiTltQTz-kJxdR6A323ihS6Y civitai也都抓的到 https://civitai.red/?sync-account=green ComfyUI目前建議不要隨便更新 他們常常想幹嘛就幹嘛 常常破壞性更新 除非你有自行除錯的能力 就算你用N卡也有可能一更新就發現怎麼性能下降 甚至工作流直接報錯 非RDNA4架構的使用者 可以嘗試使用這個版本 bilibili.com/video/BV1LijF6iE8J/?spm_id_from=333.1387.list.card_archive.click 這個UP主我在QQ群有跟他交流分享 他本身是7900XT的用戶 基本上理念是不賣課免費分享 我將優化過的SageAttention1 Triton分享給他 跟怎麼調整參數也一併說明 讓7900XTX基本上提速30~40% 算是造福不少老卡用戶 https://www.bilibili.com/video/BV1PjEW6sEfD/?share_source=copy_web&vd_source=eb2d0f76cdb7d14c8bb995ec40576315 他比較傾向照顧所有A卡使用者 RDNA1~4全部支持跑ComfyUI 甚至照顧一群小白把屎把尿的 更新就沒有我的便攜包激進 我只單獨針對RDNA4調整比較沒包袱 我實在沒什麼耐心面對那麼多小白 不過也能去看他影片學習工作流怎麼使用 他都是跟A卡做試配的 最後一些圖片分享 https://i.imgur.com/mTsLAzH.jpeg
https://i.imgur.com/NLTJknJ.jpeg
https://i.imgur.com/7Rt8I8H.jpeg
https://i.imgur.com/lzC3lOo.jpeg
https://i.imgur.com/CsdkAOx.jpeg
https://i.imgur.com/HpAeniO.jpeg
https://i.imgur.com/HateKwx.jpeg
ANIMA基本上只要你想 怎麼玩都可以 https://i.imgur.com/jHPklY8.jpeg
多角色PLAY也不是問題 ROCm這半年加強舊卡支援 https://i.imgur.com/WHWnnao.png
也算是戰未來? 即將ROCm迎來8.0 AMD下半年如何 等7/22 Advancing Al 2026吧 -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 125.229.59.186 (臺灣) ※ 文章網址: https://www.ptt.cc/bbs/PC_Shopping/M.1782047488.A.7C9.html
文章代碼(AID): #1gD-C0V9 (PC_Shopping)
文章代碼(AID): #1gD-C0V9 (PC_Shopping)