Re: [閒聊] HTPC/CAT建構的自身經驗

看板Headphone (耳機)作者 (Oswyn)時間5年前 (2020/03/16 02:22), 5年前編輯推噓32(32059)
留言91則, 16人參與, 5年前最新討論串5/8 (看更多)
WASAPI (push) 是較新的 WaveRT Port Driver、使用 cyclic buffers,Audio device 需要支援 DMA。有人不推是因為部分 Audio device 相容性不佳,為了省麻煩就叫你別 用,不用就不會有機會有問題。話說什麼年代了硬體還不支援 DMA(笑)、硬體相容性 、支援度不佳並不是這個模式的問題。用 WASAPI (push) 有問題該吐草的是兩光硬體 或其不良驅動程式。但你知道的做 Audio 設備的很多在這塊通常都.... WASAPI (event) 是舊式的 "ping-pong" buffers。 工作正常 Buffer 大小能滿足傳輸的話兩者沒有不同。不管是 WASAPI or ASIO 其功能 都只是在程式與 Audio interface 間傳遞 Audio data 並不決定聲音品質。 Buffer 是拿來緩衝的,夠大傳輸就不容易出包不易有 Pops、Clicks and Cracks 這些 音頻故障。只是聽個音樂而不是二、三十個音軌在混音*n個 plug-in 在 DSP,除非 硬體或驅動有問題啦... in foobar【讀檔>解碼>ReplayGain>DSP chain>Output】=>Audio Device 一連串的 Audio playback stream,在其中一個地方強迫資料流變得零碎並不會讓它 變實時只是形成瓶頸,更容易發生音頻故障。 Audio interface 都有硬體最小 buffer size 限制與實際最大 buffer size。 一般常見的最小 size 是 30000 hundred-nanosecond、也就是 3 ms。但這不代表這硬 體在 3ms 一定能完美工作就是了,畢竟能不能操極限是要看整台設備的軟硬體。 而 foobar2000 的 foo_out_wasapi 寫的很陽春,它沒有互動也沒有防呆雖然功能上是 沒有問題啦。 在設定中向 WASAPI 提出的是 buffer size 的【請求】,實際上 WASAPI 會依據 audio frame 的大小(ch 數 * bit-depth * Sample rate)來回應一個可行 buffer size。 零是不可能的、也不能比硬體的最小 buffer size 要小。以上面的例子 3ms 會回給一 個能放 3.xx ms audio大小的 buffer。而 audio 的位元深與採樣率會影響實際大小。 太小的 buffer size 對 WASAPI (push) 的 cyclic buffers 不利。Cyclic buffers 是你追我跑的環形緩衝區,設太小=跑道太短會很容易撞車。cyclic buffers 是先進 先出(FIFO)其延遲是看硬體自發性的讀取。foobar 是 music player 所以 audio data 都是已知的,buffer size 設大點沒什負面問題但最好不要設的太小。 WASAPI (event) 的 "乒乓" buffers 則不能設太大,如上述沒有防呆。如果在此 設定了超過硬體的最大值,多出來的部分則會丟失。 極端例子如硬體最大 buffer size 只有 250ms 如果設了 500ms,foobar 每次會傳送 500ms 的 audio 但硬體只能實收 250ms 然後播放、多出來的 250ms audio 會被放生 。然後 foobar 會再送下一個 500ms...250ms 被播放 250ms 被放生。會聽到很嚴重的 輟音,然後進度條跑的飛快。以此例五分鐘的音樂會跳針成二分半就播完。 但如果只設成大了點,只丟失幾個 samples 輟音不夠嚴重,如不知原因可能只會聽出 比較不好聽。但根源上的問題是設定已經錯誤了,但 foo_out_wasapi 並沒有防呆也 沒有任何互動告知使用者的 buffer size 出問題。 應該些人聽信 push mode 不可用,用 event mode 設大有問題所以得出小=好的結論 另如上述如果硬體的 buffer size 最小值是 3ms,這代表設成 0~3ms 之間的任何值 WASAPI 所回應的 buffer size 大小都會是相同的,所以聽起來不可能會有不同。 但如果使用者覺得設成 0ms 最棒,那有什麼理由不能說 3ms、5ms、10ms、50ms 到超 過最大值前聽起來都跟設成 0ms 一樣好?有人能挑戰用聽的聽出硬體的最小 buffer size 值?如果小真的好音質真有差、盲測應該能分辨出最小 buffer size 這個界線才 是。 聽出硬體最大 buffer size 大致上的大小應該不難,基本上這就是嚴重的音頻故障。 因為就算每次只最小丟失一個 sample 也會因為定時定頻率重複發生而顯得明顯。參考 出問題/正常的分界適中的設定 event mode 的 buffer size 應該是不錯的選擇。 在這部分應只有 audio interface 耗盡 audio data 而後面的 audio data 來不及備 妥產生的音頻故障,而沒有正常備妥&傳輸但影響音質的問題。 另外這的 32-bit 指的是 32-bit float?不論是整數或浮點,在 source audio data 一般最高只有 24-bit 的 playback 的狀況下這應該沒有什好處。只會增加無謂的資料 傳輸量,這會讓低延遲的設定環境更容易撞車。除非有進行 DSP 不然看不出會有好處 就是了。 -- 人間五十年、化天のうちを比ぶれば、夢幻の如くなり ^,,,^ 一度生を享け、滅せぬもののあるべきか (ω)\m/ NOBUMETAL DEATH!!('ω') -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 114.45.253.183 (臺灣) ※ 文章網址: https://www.ptt.cc/bbs/Headphone/M.1584296563.A.A8F.html

03/16 05:21, 5年前 , 1F
怎麼我感覺看了很多,但又不知道結論是什麼,我的問題嗎?
03/16 05:21, 1F

03/16 06:39, 5年前 , 2F
看不懂QQ,不過我在網路上查到的都是說event比push還要
03/16 06:39, 2F

03/16 06:39, 5年前 , 3F
新?
03/16 06:39, 3F

03/16 08:12, 5年前 , 4F
hi 感謝你的解釋,我其實沒能力知道driver底層的機制,
03/16 08:12, 4F

03/16 08:12, 5年前 , 5F
所以建議壓低buffer只是沿用過去CAT玩家的原則,在不出
03/16 08:12, 5F

03/16 08:12, 5年前 , 6F
事的情況下壓低各種buffer與latency
03/16 08:12, 6F

03/16 08:19, 5年前 , 7F
至於這樣對聽感的影響,就像我之前推文提到的,我只能
03/16 08:19, 7F

03/16 08:19, 5年前 , 8F
解釋到低延遲對SI有好處,然後音頻裝置吃到高品質數位
03/16 08:19, 8F

03/16 08:19, 5年前 , 9F
訊號對聽感有助益,至於是讓receiver工作的更好還是這
03/16 08:19, 9F

03/16 08:19, 5年前 , 10F
樣的SI品質會一路串到da線路影響解出來的類比訊號品質
03/16 08:19, 10F

03/16 08:19, 5年前 , 11F
就非我能解釋的了
03/16 08:19, 11F

03/16 08:22, 5年前 , 12F
然後32bit云云,就data層面確實就是補0,是不是真的有
03/16 08:22, 12F

03/16 08:22, 5年前 , 13F
差我也不確定,當心理作也可以
03/16 08:22, 13F
但以 32-bit 傳輸 24-bit 的資訊表示 data payload 無謂的增加 更耗時耗功、事實上也增加了系統 DPC Latency DPC Latency 不佳最常見的狀況就是有問題的硬體或驅動佔了茅坑不拉屎 卡住了後面排隊的,今天 24-bit 精度的 Audio 以 32-bit 傳送就表示 3秒能傳完的要花4秒,多佔用了1/4的時間,然後只是沒用的零 而且耗的點是直接加諸在 Audio interface & controller 所以說有沒有差也不確定,這跟原原PO 你把 WASAPI 兩個 mode 的 buffer 都設成了零一樣。既然不能確定就照不知道有什麼原理的經驗法則 這不都只是心理用而已了嗎 能真心肯定的說出設成 0ms 真的比 10ms 好,因為是 ABX 盲測出來的確定結 果,而不是因為過去CAT玩家的原則所影響的?

03/16 09:10, 5年前 , 14F
感謝資訊 真複雜...
03/16 09:10, 14F

03/16 10:08, 5年前 , 15F
感謝,專業推!!
03/16 10:08, 15F

03/16 12:12, 5年前 , 16F
O大文,每次都讀的好開心
03/16 12:12, 16F

03/16 12:14, 5年前 , 17F
推好文
03/16 12:14, 17F

03/16 12:52, 5年前 , 18F
可惜音響上面偏偏就是buffer小聲音比較真,buffer大聲音
03/16 12:52, 18F

03/16 12:52, 5年前 , 19F
會變滑順浮腫
03/16 12:52, 19F

03/16 13:25, 5年前 , 20F
我想文章意思是,小有個極限,大的話event也是有極限
03/16 13:25, 20F

03/16 13:25, 5年前 , 21F
在軟體UI上看到的設定值不一定是實際值
03/16 13:25, 21F

03/16 15:39, 5年前 , 22F
底層機制一定是這樣,看願意開放多少彈性給應用層
03/16 15:39, 22F
其實在 Audio 的相關 Latency 出現在很多地方,也有不同的意義 個人感想是可能很多玩家搞混了這些不同的 Latency 像合成樂器的 Latency About Latency / VST Instruments | Steinberg.help https://bit.ly/3b2KOez 這的 Latency 就只是延遲,譬如樂創作者接到電腦的 Keyboard 琴鍵按下去 要 400ms 後聲音才發出來。這延遲會讓人感到不舒適但不會影響音質 同樣的在現場進行 RT監聽的狀況設備的 Latency 也會是重要的關鍵 DAC digital filters 的兩個主要分類 IIR & FIR 的重要參數 Latency https://imgur.com/ZN6kYvy
Latency 較低的 IIR 系因較沒有 "pre-ringing" 受部分人士的喜好 但這的 Latency 也只是 digital filters 的特性所表現出來的結果 而不是因為低 Latency 所以聲音好 但傳輸過程中的 Buffer 造成的 Latency... 我要說的是不管是 WASAPI or ASIO 都只是整個傳輸過程中的其中一段 這就像用卡車在送貨,你可以只裝一、二箱就出車,也以裝幾十箱再出車 但收貨方的需求如果是持續且定時定量的話,你就必需一直出貨 每次送的少你就必需發更多車 一次裝的多就可以少出點車次,但等貨裝貨的時間就=Latency 為什麼車在跑的時間沒什麼人在計算 Latency?因為以現在的電腦來說這個時 間太短了,有部分 DAW 如 PEAPER 有 Performance Monitor 計算實際時間 但在路上每台車都會碰上各種交通狀況,這就是 DPC Latency 所反應給你的 每次送的少、收貨方的備貨就少,容錯值就低。貨架空了就是音頻故障 每次送的少=Latency 低、是比較新鮮啦,但就如上述除了有互動需求的話 早個幾 ms 聽到的音樂是會比較鮮啦、但 Audio data 又不是生鮮 跟 SI 又有什麼關係就實在讓人搞不清楚了 另外車次多、排放就高,所需要的總 CPU 時間也會更多產生的熱能也更多 這方面的負面影響又要如何考量? 這就又回到跟上面討論的 24-bit vs 32-bit 類似的狀況,一個感覺問題而已

03/16 20:47, 5年前 , 23F
精闢解析
03/16 20:47, 23F

03/16 21:04, 5年前 , 24F
嘿,針對32bit,我思考的角度是,wasapi會不會統一吃32
03/16 21:04, 24F

03/16 21:04, 5年前 , 25F
bit data也就是我說的預設格式,傳24給他,他還要再補0
03/16 21:04, 25F

03/16 21:04, 5年前 , 26F
,跟你舉例的情形剛好相反,但我也說了只是我猜的,我
03/16 21:04, 26F

03/16 21:04, 5年前 , 27F
也不排除是心理作用
03/16 21:04, 27F

03/16 21:09, 5年前 , 28F
另外感謝你解釋了DPC latency的含義,至於buffer大小,
03/16 21:09, 28F

03/16 21:10, 5年前 , 29F
我最早也不信,現在自己跟著用。但確實也不可能每個buf
03/16 21:10, 29F

03/16 21:10, 5年前 , 30F
fer設定都給他測試看看,你要這樣質疑我也無法反駁,
03/16 21:10, 30F

03/16 21:10, 5年前 , 31F
頂多爭辯一句這不是只有我自己在心裡感覺。實際上不管
03/16 21:10, 31F

03/16 21:10, 5年前 , 32F
是中文 英文 甚至是日文資訊,全世界在討論CAT的社群在
03/16 21:10, 32F

03/16 21:10, 5年前 , 33F
這幾部分的看法幾乎都是相似的,但要說誰有辦法解釋的
03/16 21:10, 33F

03/16 21:10, 5年前 , 34F
很嚴謹完整,我也沒見過就是
03/16 21:10, 34F

03/16 21:14, 5年前 , 35F
跟SI關係,看來我比較多是用dpc latency在想,單純buff
03/16 21:14, 35F

03/16 21:14, 5年前 , 36F
er大小部分,看來又是塊我是無法解釋的東西
03/16 21:14, 36F

03/16 21:15, 5年前 , 37F
03/16 21:15, 37F
還有 19 則推文
還有 2 段內文
03/16 23:39, 5年前 , 57F
部分人都是去被電的 要戰三小XD
03/16 23:39, 57F

03/17 08:06, 5年前 , 58F
hi 簡單回一下,buffer大小當然是自己測過有效才會用,
03/17 08:06, 58F

03/17 08:06, 5年前 , 59F
記得比較清楚的是錄音介面的buffer,從預設512 samples
03/17 08:06, 59F

03/17 08:06, 5年前 , 60F
調到最低16 samples之類,但確實應該沒人會16 32 64 12
03/17 08:06, 60F

03/17 08:06, 5年前 , 61F
8這樣試
03/17 08:06, 61F

03/17 08:08, 5年前 , 62F
另外我也同意人耳不是非常可靠,所以都是要找一些原則
03/17 08:08, 62F

03/17 08:08, 5年前 , 63F
出來,不然軟硬體設定多如牛毛,又藏著一堆改變非改善
03/17 08:08, 63F

03/17 08:08, 5年前 , 64F
的陷阱
03/17 08:08, 64F

03/17 08:11, 5年前 , 65F
另外針對人云亦云,其實也是在認同一些原則後,看人家
03/17 08:11, 65F

03/17 08:11, 5年前 , 66F
分享的東西你覺得值不值得試,因為有時候是單純不知道
03/17 08:11, 66F

03/17 08:11, 5年前 , 67F
可以這樣去動設定
03/17 08:11, 67F

03/17 08:14, 5年前 , 68F
最後每人喜好音色云云,我倒是覺得錄製階段有這回事,
03/17 08:14, 68F

03/17 08:14, 5年前 , 69F
那是藝術家的權利,但到了重播階段,改善與改變是不同
03/17 08:14, 69F

03/17 08:14, 5年前 , 70F
的兩回事,要能分辨需要累積聽感與對自然聲音的認知
03/17 08:14, 70F

03/17 09:23, 5年前 , 71F
謝謝你的解釋, 可是我還是比較喜歡低Latency, 高bit rate
03/17 09:23, 71F

03/17 16:10, 5年前 , 72F
Buffer並非越小越好,最少要Payload Size的4倍
03/17 16:10, 72F

03/17 16:13, 5年前 , 73F
Payload Size又會影響Throughput,以8B/10B來計算
03/17 16:13, 73F

03/17 16:14, 5年前 , 74F
有25% overhead,Payload Size=256byte,throughput約92%
03/17 16:14, 74F

03/17 16:15, 5年前 , 75F
再加上Completion latency,Flow control update latency
03/17 16:15, 75F

03/17 16:16, 5年前 , 76F
另外像是BIOS中的CPU節能技術,會影響DMA讀寫
03/17 16:16, 76F

03/17 16:17, 5年前 , 77F
提高latency,這些設定是環環相扣
03/17 16:17, 77F

03/17 18:39, 5年前 , 78F
這串太專業了,可以簡單說結論嗎
03/17 18:39, 78F

03/17 18:56, 5年前 , 79F
就其實還是回歸到自己最喜歡的聽感而已 這些只是調整
03/17 18:56, 79F

03/17 18:56, 5年前 , 80F
參數之一 供你玩
03/17 18:56, 80F
喜好這東西本就各形各色啦 NOS 這種嚴重失真的都會有些人覺得自然好聽了 但設完是不是真能分辨就是另一回事了 人耳不精準&人腦是不可信的,換個盤子的顏色都會影響到味覺判斷了 我並沒有想要戰什麼的意思,但沒有 ABX 就沒有真相只是走感覺流並不理性

03/17 19:36, 5年前 , 81F
唱一下莫文蔚的陰天一下
03/17 19:36, 81F

03/17 21:05, 5年前 , 82F
簡單說就是要依據worst-case來調整,就像船期最長間隔
03/17 21:05, 82F

03/17 21:06, 5年前 , 83F
會影響備貨數量,包裝大小也會影響,包裝大一個箱子能裝
03/17 21:06, 83F

03/17 21:07, 5年前 , 84F
的數量少,sample rate越高,Buffer也要越大
03/17 21:07, 84F

03/17 21:44, 5年前 , 85F
碎嘴一下,NOS也是有好處的,thd很差那是頻響域,對應
03/17 21:44, 85F

03/17 21:44, 5年前 , 86F
的時間域,NOS反倒表現的很好,而人耳比起頻響域,對
03/17 21:44, 86F

03/17 21:44, 5年前 , 87F
時間域反而更敏感
03/17 21:44, 87F
但 NOS 完全沒法重建原始 Audio 帶有大量的噪聲與失真及混疊,除了整體響度會下降且越往高頻越失真與衰減 但有些人就喜歡失真跟討厭高頻啦XD Nyquist frequency 之所以能以離散數據重建 Audio 就是因為需要以正弦補值 沒有 OS 以單單的 PCM 點所重建的階梯並不能說是完成了 DAC

03/17 22:08, 5年前 , 88F
ABX只能測聽不聽得出OS/NOS的差異阿
03/17 22:08, 88F

03/17 22:08, 5年前 , 89F
不能處理個體覺得哪一種好聽/哪個失真較高 這類的問題
03/17 22:08, 89F
你熟的音樂不用 ABX 多半就能分辨 NOS 的聲音很特殊

03/17 22:37, 5年前 , 90F
應該用sync補吧XD
03/17 22:37, 90F
sinusoid 用 sinc 是因為計算問題啊 如果有其它算法能補正弦波、沒震鈴又效能好那就發財了啊

03/17 23:08, 5年前 , 91F
OS跟NOS已經吵了很久啦 我自己的DAC兩種都能切換
03/17 23:08, 91F
肥環燕瘦各有人愛啦 但我舉 NOS 只是為了表示就訊號重建的角度 NOS 完全 OUT 以 Nyquist frequency 採樣的數據並沒有遵照 Nyquist frequency 重建 ※ 編輯: Oswyn (220.129.177.54 臺灣), 03/17/2020 23:33:49
文章代碼(AID): #1URd9pgF (Headphone)
討論串 (同標題文章)
文章代碼(AID): #1URd9pgF (Headphone)