[討論] Dither (in數位音訊)

看板AudioPlayer作者exFREEzy (~RadicalDreamer~)時間17年前 (2008/03/20 03:31)推噓0(0推 0噓 0→)

留言0則, 0人參與討論串1/3 (看更多)

Dither 中文似乎譯作：高頻振動看過大陸這樣翻主要轉貼 kouyoumin 發問的『Dither 的影響』 http://forums.dearhoney.idv.tw/viewtopic.php?p=183297 先轉貼最小篇幅的文章〔作者：hotball〕 http://forums.dearhoney.idv.tw/viewtopic.php?f=3&t=29565&p=183201#p183201 －－－－－－－－－－－－－－－－－－－－－－－－－－－－－－－－－－－－－－－ Dithering 通常會增加量化誤差(也就是雜訊會變多)，但是會減少失真(指人的感覺上)。這是因為，在沒有 dithering 的情形下，量化誤差會比較集中在低頻部份。而加上 dithering 後，低頻部份的量化誤差會減少，而轉移到高頻。由於對大部份情形來說，高頻是比較不重要的，所以這樣是可以減少失真的。所以，在使用 dithering 的情形下，取樣率要高到某個程度以上才行（即讓其高頻部份超出人所能偵知的範圍）。對於影像訊號來說，當解析度高到某個程度時，人眼就無法分辨各別的 pixels （所以 dithering 的圖遠看會比較好看）。聲音的情形也類似，因為人耳無法聽到某個頻率以上的聲音。但是若取樣率不夠高的話，則 dithering 所造成的高頻量化誤差的增加，就不一定會有好的效果。－－－－－－－－－－－－－－－－－－－－－－－－－－－－－－－－－－－－－－－每次整理這種名詞解釋文章似乎都會提到一篇網友 LukeLo 的「漫談數位音樂」 2001/07/05刊出 http://www.dearhoney.idv.tw/?p=29 http://www.dearhoney.idv.tw/Audio/LukeLo20010705/ 節錄其中對於 Dither 的說明－－－－－－－－－－－－－－－－－－－－－－－－－－－－－－－－－－－－－－－ Dither是數位音樂處理上非常神奇的技巧，目的是用少數的 bits 達到與較多 bits 同樣的聽覺效果，方法是在最後一個 bit (LSB: Least Significant Bit)動手腳。例如用 16bits 紀錄聽起來好似 20bits 的資料，聽到原先 16bits 無法紀錄的微小資訊舉例來說，今天我有個 20 bits 的取樣資料，我現在想把存成 16 bits 的資料格式，最簡單的轉換方式就是直接把後面四個 bits 直接去掉，但是這樣就失去用 20 bits 錄音／混音的意義。比較技巧性的方法是在第 17~20 bits 中加入一些噪音，這段噪音就叫做 dither。這些噪音加入後，可能會進位而改變第 16 個 bit 的資料，然後我們再把最後四個 bits 刪掉，這個過程我們稱為 redithering，用意是讓後面四個 bits 的資料線性地反映在第 16 個 bit 上。由於人耳具有輕易將噪音與樂音分離的能力，所以雖然我們加入了噪音，實際上我們卻聽到了更多音樂的細節。關於 dither 有種比喻是說我們透過手指間的細縫只能看到眼前部分的圖形，但是如果前後揮動手掌，就可以透過不同時刻看到的各個圖形的一小部份，在腦中建構出完整的圖形資訊，這是大腦神奇的地方，不是簡單的理論就可以說得通的。在此我提供一個網址，該網頁內提供經過 dither 處理和原始的 wav 檔下載，內容是一個固定頻率的聲音以等比例逐漸降低音量，我們可以發現經過 dither 處理過的聲音聽起來失真比較少且持續比較久，也就是可以讓我們聽到更小的音量與細節，還附有 dither 前後的波型圖示，網址如下：（連結失效）http://www.mtsu.edu/~dsmitche/rim420/reading/rim420_Dither.html。在眾多的 dither 技術中，Sony 公司的 SBM (Super Bit Mapping)， LIVE STUDIO RECORDINGS 的 ULTRA MATRIX PROCESSING，都是專攻 20 bits 轉 16 bits 的技術。 Dither 在數位音訊處理用途非常廣泛，舉凡兩個波型的相加、振幅的縮放、Normalize 都會用到。現在的錄音室已經進展到 24 bits 錄音，在 CD 還是主流儲存媒體的時代，dither 還是非常重要的技術。順道一提，在影像處理領域，將 24 bits 的全彩圖形以 16 bits 的高彩畫面顯示也會用到 dither 的技術。後續討論：http://forums.dearhoney.idv.tw/viewtopic.php?f=3&t=16778 －－－－－－－－－－－－－－－－－－－－－－－－－－－－－－－－－－－－－－－接著繼續介紹相關有用的資訊： teamJDK 的「看圖理解音訊 Dither」推薦指數：★★★★★ http://forums.dearhoney.idv.tw/viewtopic.php?f=3&t=29565&p=183297#p183297 －－－－－－－－－－－－－－－－－－－－－－－－－－－－－－－－－－－－－－－人耳對具有週期性的聲音、頻譜上特別突出的頻率（formant）、隨時間變化而移動的突出頻率特別敏感。當聲音從高解析度降低為低解析度的時候，捨棄末尾 bit 所造成增加的 quantization error，會和原本的聲音訊號有高度的"關連性"，會造成很明顯的泛音失真，人耳對這種突出的泛音失真會很敏感。 dither 在音訊中加入所造成的是一種 white noise，也就是能量在各個頻率都一樣的 noise。這種 noise 是隨機的、亂序的、不規則的，我們對這種訊號，大腦會認為這是比較不重要的、沒有意義的、無法 tracking 的，所以會自動降低對它的敏感度，直接把它忽視掉。所以我們就利用這樣的特性，在由高解析度轉為低解析度之前，先對原始的聲音訊號加入一個隨機的雜訊，這個雜訊會增加整體的雜訊量，但是會不規則打破原本的 quantization error，消除 quantization error 和原本訊號之間的"關連"。也就是用我們比較可以忍受、比較不會去注意到的"沙沙沙"的 white noise，去取代原本突出的泛音失真。（圖片部份請自行參閱）加入 dither 後的頻譜，注意到總 noise 量比原本多，但是突出泛音的失真卻沒有了，這些原本由於（關連於）sine wave 產生的 quantization error 已經被加入的亂序的、擾動的 dither 給打破了另外，dither 同時具有將低位元的 information 帶到高位元的作用。最後因為我們對不同頻率的敏銳度不一樣，所以如果加入的 dither(noise) 能夠做適當的選擇，讓這個雜訊的能量在我們比較不注意的高頻比較多，而低頻比較少，這樣加入 dither 所造成的增加 noise 的副作用，就比較不會被我們察覺到。為此各家都有不同的演算法，不同的 dither + noise shaping 技術，例如最有名的 Apogee 公司用的 "UV22"。－－－－－－－－－－－－－－－－－－－－－－－－－－－－－－－－－－－－－－－ -- Ｔｏ　ｂｅ　Ｃｏｎｔｉｎｕｅｄ。。。 -- ※ 發信站: 批踢踢實業坊(ptt.cc) ◆ From: 119.77.133.140 ※ 編輯: exFREEzy 來自: 119.77.133.140 (03/20 04:59)