[討論] Dither (in數位音訊)
看板AudioPlayer作者exFREEzy (~RadicalDreamer~)時間16年前 (2008/03/20 03:31)推噓0(0推 0噓 0→)留言0則, 0人參與討論串1/3 (看更多)
Dither 中文似乎譯作:高頻振動 看過大陸這樣翻
主要轉貼 kouyoumin 發問的『Dither 的影響』
http://forums.dearhoney.idv.tw/viewtopic.php?p=183297
先轉貼最小篇幅的文章〔作者:hotball〕
http://forums.dearhoney.idv.tw/viewtopic.php?f=3&t=29565&p=183201#p183201
---------------------------------------
Dithering 通常會增加量化誤差(也就是雜訊會變多),但是會減少失真(指人的感覺上)。
這是因為,在沒有 dithering 的情形下,量化誤差會比較集中在低頻部份。
而加上 dithering 後,低頻部份的量化誤差會減少,而轉移到高頻。
由於對大部份情形來說,高頻是比較不重要的,所以這樣是可以減少失真的。
所以,在使用 dithering 的情形下,取樣率要高到某個程度以上才行
(即讓其高頻部份超出人所能偵知的範圍)。
對於影像訊號來說,
當解析度高到某個程度時,人眼就無法分辨各別的 pixels
(所以 dithering 的圖遠看會比較好看)。
聲音的情形也類似,因為人耳無法聽到某個頻率以上的聲音。
但是若取樣率不夠高的話,
則 dithering 所造成的高頻量化誤差的增加,就不一定會有好的效果。
---------------------------------------
每次整理這種名詞解釋文章 似乎都會提到一篇
網友 LukeLo 的「漫談數位音樂」 2001/07/05刊出
http://www.dearhoney.idv.tw/?p=29
http://www.dearhoney.idv.tw/Audio/LukeLo20010705/
節錄其中對於 Dither 的說明
---------------------------------------
Dither是數位音樂處理上非常神奇的技巧,
目的是用少數的 bits 達到與較多 bits 同樣的聽覺效果,
方法是在最後一個 bit (LSB: Least Significant Bit)動手腳。
例如用 16bits 紀錄聽起來好似 20bits 的資料,聽到原先 16bits 無法紀錄的微小資訊
舉例來說,
今天我有個 20 bits 的取樣資料,我現在想把存成 16 bits 的資料格式,
最簡單的轉換方式就是直接把後面四個 bits 直接去掉,
但是這樣就失去用 20 bits 錄音/混音的意義。
比較技巧性的方法是在第 17~20 bits 中加入一些噪音,這段噪音就叫做 dither。
這些噪音加入後,可能會進位而改變第 16 個 bit 的資料,
然後我們再把最後四個 bits 刪掉,這個過程我們稱為 redithering,
用意是讓後面四個 bits 的資料線性地反映在第 16 個 bit 上。
由於人耳具有輕易將噪音與樂音分離的能力,所以雖然我們加入了噪音,
實際上我們卻聽到了更多音樂的細節。
關於 dither 有種比喻是說我們透過手指間的細縫只能看到眼前部分的圖形,
但是如果前後揮動手掌,就可以透過不同時刻看到的各個圖形的一小部份,
在腦中建構出完整的圖形資訊,這是大腦神奇的地方,不是簡單的理論就可以說得通的。
在此我提供一個網址,該網頁內提供經過 dither 處理和原始的 wav 檔下載,
內容是一個固定頻率的聲音以等比例逐漸降低音量,
我們可以發現經過 dither 處理過的聲音聽起來失真比較少且持續比較久,
也就是可以讓我們聽到更小的音量與細節,還附有 dither 前後的波型圖示,網址如下:
(連結失效)http://www.mtsu.edu/~dsmitche/rim420/reading/rim420_Dither.html。
在眾多的 dither 技術中,Sony 公司的 SBM (Super Bit Mapping),
LIVE STUDIO RECORDINGS 的 ULTRA MATRIX PROCESSING,
都是專攻 20 bits 轉 16 bits 的技術。
Dither 在數位音訊處理用途非常廣泛,
舉凡兩個波型的相加、振幅的縮放、Normalize 都會用到。
現在的錄音室已經進展到 24 bits 錄音,
在 CD 還是主流儲存媒體的時代,dither 還是非常重要的技術。
順道一提,在影像處理領域,
將 24 bits 的全彩圖形以 16 bits 的高彩畫面顯示也會用到 dither 的技術。
後續討論:http://forums.dearhoney.idv.tw/viewtopic.php?f=3&t=16778
---------------------------------------
接著繼續介紹相關有用的資訊:
teamJDK 的「看圖理解音訊 Dither」 推薦指數:★★★★★
http://forums.dearhoney.idv.tw/viewtopic.php?f=3&t=29565&p=183297#p183297
---------------------------------------
人耳對具有週期性的聲音、
頻譜上特別突出的頻率(formant)、
隨時間變化而移動的突出頻率特別敏感。
當聲音從高解析度降低為低解析度的時候,
捨棄末尾 bit 所造成增加的 quantization error,
會和原本的聲音訊號有高度的"關連性",
會造成很明顯的泛音失真,人耳對這種突出的泛音失真會很敏感。
dither 在音訊中加入所造成的是一種 white noise,
也就是能量在各個頻率都一樣的 noise。
這種 noise 是隨機的、亂序的、不規則的,
我們對這種訊號,大腦會認為這是比較不重要的、沒有意義的、無法 tracking 的,
所以會自動降低對它的敏感度,直接把它忽視掉。
所以我們就利用這樣的特性,
在由高解析度轉為低解析度之前,先對原始的聲音訊號加入一個隨機的雜訊,
這個雜訊會增加整體的雜訊量,但是會不規則打破原本的 quantization error,
消除 quantization error 和原本訊號之間的"關連"。
也就是用我們比較可以忍受、比較不會去注意到的"沙沙沙"的 white noise,
去取代原本突出的泛音失真。
(圖片部份請自行參閱)
加入 dither 後的頻譜,注意到總 noise 量比原本多,
但是突出泛音的失真卻沒有了,
這些原本由於(關連於)sine wave 產生的 quantization error
已經被加入的亂序的、擾動的 dither 給打破了
另外,dither 同時具有將低位元的 information 帶到高位元的作用。
最後因為我們對不同頻率的敏銳度不一樣,
所以如果加入的 dither(noise) 能夠做適當的選擇,
讓這個雜訊的能量在我們比較不注意的高頻比較多,而低頻比較少,
這樣加入 dither 所造成的增加 noise 的副作用,就比較不會被我們察覺到。
為此各家都有不同的演算法,不同的 dither + noise shaping 技術,
例如最有名的 Apogee 公司用的 "UV22"。
---------------------------------------
--
To be Continued。。。
--
※ 發信站: 批踢踢實業坊(ptt.cc)
◆ From: 119.77.133.140
※ 編輯: exFREEzy 來自: 119.77.133.140 (03/20 04:59)
討論串 (同標題文章)
完整討論串 (本文為第 1 之 3 篇):
10
10
AudioPlayer 近期熱門文章
PTT數位生活區 即時熱門文章