[心得] 創造一個符合自己美學的 dsp 聲音

看板Headphone (耳機)作者 (howard50009)時間4小時前 (2026/04/19 07:33), 44分鐘前編輯推噓4(404)
留言8則, 4人參與, 49分鐘前最新討論串1/1
過去在聽許多耳機、音響時,總發現許多高級器材呈現出的聲音,有著非常好的清晰 度,以及某種透明、穿透感。 好的器材有很多,奈何更多極好的器材就是很貴。我一直想著,如果我們能用平價的 器材,結合軟體就能聽到好聲音,或是能優化聽感,比起頻繁換實體物件,或許更容易能 享受到那種高級感的聲音,那會是多麼棒的事。 由於我曾接觸過一些混音的流程,加上自己也從事軟體業,略懂一些插件製作的原理 ,於是藉助與 AI 協作設計開發,根據數學定義設計了一套演算法(FFT, Self-reprojection validation,… etc),構建一個符合自身美學的聲音,目的是想優化 平價器材上的頻段遮蔽,並且適度減少部分單體本身因為錄音失真/重放失真的殘響與混 響、修復聽感上的相位,試圖讓高級器材的"具象化"能從一般平價器材輕鬆被感受到。 使用的技術是音頻實時處理,可以在瀏覽器上使用插件,也就是只要對任何串流平台 例如 spotify 或 kkbox,甚至 youtube 影片的音質不滿意,都可以使用此工具並做優化 由於我自身滿意這樣的聲音,想推廣給大家使用,但如要做成產品,還需要許多人的意 見改善,目前仍在考慮未來的走向,但可以肯定的是如果未來有進階功能的話,我 會做一個使用此管線優化的 windows 系統桌面應用,目前會先徵求大家的意見,來確立 後續優化的方向。(其實 windows 部份我也做好了,只是如果後續有人喜歡再放) Chrome Extension 可搜尋 Phaselith 目前 preview 免費使用 如覺得喜歡聲音,都歡迎給評論 feeback 插件網址 https://reurl.cc/A960Gj 另外也開了 google 問卷,對後續調音走向有興趣的燒友也可以協助填表 https://forms.gle/rxafLQdk5yksAMXz9 -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 111.252.8.14 (臺灣) ※ 文章網址: https://www.ptt.cc/bbs/Headphone/M.1776555211.A.D32.html

04/19 08:45, 2小時前 , 1F
win版本對比elgato wave link有什麼功能上的優勢嗎
04/19 08:45, 1F

04/19 08:45, 2小時前 , 2F
?wave link是系統層的而且可以指定輸出&程式單獨建
04/19 08:45, 2F

04/19 08:45, 2小時前 , 3F
立,也不會影響AmazonMusic之類的程式獨佔DAC
04/19 08:45, 3F

04/19 08:45, 2小時前 , 4F
如果你的東西有辦法封裝成標準的VST3作為插件可能不
04/19 08:45, 4F

04/19 08:45, 2小時前 , 5F
04/19 08:45, 5F
感謝給的建議,目前技術來說最大的差異是延遲還有音質本身 Wavelink 目前我看他的架構猜是用虛擬音效卡驅動,可能會被多重 SRC (因為每個 app 用的取樣很可能會不同,為了兼容它又要再耗損一次) 目前的理解是 WASAPI Exclusive 能跟他兼容,因為是把 wavelink 當成音效卡, 但同時撥放時很可能造成音質耗損,因為他自己還可能要寫虛擬輸入輸出 我 win 的設計主要是專注於撥放聲音的品質,目前用的是 Rust ffi 接 windows C++ APO 的 EFX,這部分跟 WASAPI Exclusive 會衝突,但如以聽整個系統系統本身的聲音 為目的,APO 在 SRC 部分的耗損和延遲是較低的,不過實作的難度稍高,因為要在 EFX 後面接上即時 DSP 會需要做 MMAP 和 IPC 溝通... 簡單說 EFX 就是 windows 系統音訊彙整的大出口 XD 目前體驗起來 windows APO 的音質其實不差,但太容易因為系統的虛擬化 或網路搶資源,一直爆音,應該是這原因所以 windows 才不敢放出來公用 VST3 部分寫的時候就有考慮好了,整個算法都可以直接封裝,如果要做確實可行

04/19 08:49, 2小時前 , 6F
蠻有趣的插件
04/19 08:49, 6F
感謝 XD

04/19 09:20, 2小時前 , 7F
這是EQ嗎
04/19 09:20, 7F
不算是 EQ,我設計了 6 ~ 7 個疊加處理音訊的管線,目的是去除聲音本身的失真, 也加了自重投影驗證的算法,就是希望能讓訊號是符合真實錄音當初的那個聲音, 所以可能乍聽起來人聲的厚度少了(麥克風失真),或是一些製造的沒那麼自然 的 reverb 減少,但如果是真實的錄音空間反而會有更多的回音感,就算效果疊加 也能盡量保持聲音取向一致,就是能在同個基準下優化 當然這只是設計理念,希望能還原被忽視的某些細節,以及用任何器材都能在原先的基礎 上提升它們的解析和音樂性 ※ 編輯: howard50009 (111.252.8.14 臺灣), 04/19/2026 10:52:51

04/19 10:55, 49分鐘前 , 8F
蠻酷的 推推
04/19 10:55, 8F
※ 編輯: howard50009 (111.252.8.14 臺灣), 04/19/2026 11:00:10
文章代碼(AID): #1fv1JBqo (Headphone)
文章代碼(AID): #1fv1JBqo (Headphone)