您當前的位置:首頁 > 詩詞

什麼是數模轉換器?它的工作原理是什麼?

作者:由 米飯星 發表于 詩詞時間:2019-08-22

什麼是數模轉換器?它的工作原理是什麼?

在任何的數字音訊系統中,模數和數模轉化器都是其中的重要組成部分,但通常情況下,它們都得不到應有的關注。在您的音效卡將音訊傳輸到您的DAW時,您可以能不會去想是模數轉化器或者是數模轉化器驅動的您的監聽音箱;並且當您在演奏數字合成器時,是數模轉化器將您的音訊傳輸給音箱的這點可能也沒有得到過您的過多關注。

但轉換器其實真的非常重要——將膝上型電腦直接發出的聲音與透過數字埠(如USB)連線了優質的外接轉換器的膝上型電腦所發出的聲音進行比較,會聽到非常明顯的區別,連線了外接轉換器的聲音聽起來肯定會好很多。

想要弄明白模數和數模轉換器,我們就需要先了解一些基本的音訊基礎知識。聲音由氣壓的變化組成,有像海浪一樣的波峰和波谷,與我們耳朵的聽覺機制相互作用。我們的耳朵會將接收到的聲波資訊傳遞到大腦,大腦則負責處理這些資訊。從惱人的狗吠聲到交響樂團的演奏聲等等所有的聲音,實質上都是形狀和高度各異的波。通常情況下,聲音越複雜,波的形狀就越複雜。從視覺上看,在振幅(水平)與時間的關係圖中,音訊看起來像一條彎曲的線,我們稱之為波形(如圖1所示)。

什麼是數模轉換器?它的工作原理是什麼?

圖1:這張圖顯示的是一支管絃樂隊演奏的貝多芬交響曲在被麥克風轉換成不同的電壓後所產生的氣壓變化。注意,這是一個非常短的音訊片段,透過放大可以更清楚地顯示波形的形狀

在黑膠唱片上刻下波形的輪廓就形成了唱片的律動,當我們播放這張唱片時,唱針會跟隨這個波形進行播放,這會使唱機匣產生電壓變化,產生類似於聲音的原始波形,最終驅動揚聲器發聲。由於揚聲器音盆會跟隨波形運動,所以它能複製最初壓入黑膠唱片的波形。因為上述的每個階段都會傳輸一個模擬輸入訊號的訊號——因此便有了“模擬音訊”這個術語。

不幸的是,跟樂隊成員一樣,模擬音訊也有侷限性。例如,黑膠唱片的爆裂聲、滴答聲、扭曲的聲音和表面噪聲會作為不受歡迎的音訊“瑕疵”被新增到原始聲音中。錄音磁帶會新增音染,磁帶上的灰塵會導致砰砰聲和滴答聲,磁帶錄音會有嘶嘶聲,等等。因此,儘管揚聲器輸出的訊號與原始錄製的訊號相似,但由於模擬錄製、處理和回放中固有的錯誤,也不太可能和原始聲音一模一樣。

耶!數字音訊確實存在!

數字音訊透過將音訊轉換為一串數字從錄製和播放過程中刪除了許多變數,之後透過音訊鏈傳遞這些數字(我們稍後會為大家解釋為什麼這會改善聲音質量)。 模數轉換器會將模擬訊號轉換為數字。 圖2A顯示了最終將轉換為數字資料的波形。

什麼是數模轉換器?它的工作原理是什麼?

圖2A。 原始音訊

什麼是數模轉換器?它的工作原理是什麼?

圖2B。 用特定的取樣速率測量音訊電平

什麼是數模轉換器?它的工作原理是什麼?

圖2C。 為每個測量樣本指定一個數值,儲存為數字資料

什麼是數模轉換器?它的工作原理是什麼?

圖2D。 使用平滑濾波器恢復成波形形狀

圖2:模數轉換過程以一致的速率對波形進行取樣,並測量每個樣本的電平併為其指定數值。

計算機每隔幾微秒就會抓拍一次訊號(如圖2B所示),然後將這一系列抓拍或樣本轉換成代表訊號電平變化的電壓電平(如圖2C所示)。 之後,計算機會對電平進行測量並將它們轉換成一串數字(以數字資料的形式)來定義這些電壓變化。 轉換器每秒測量的次數就是取樣率,也稱為取樣頻率。

我們將其與典型的音訊系統結合起來進行說明。麥克風會拾取音訊訊號並將其傳送到模數轉化器來將音訊訊號轉化成數字訊號。計算機接收到這一串數字資訊後會對其進行處理 - 例如,在播放之前將其延遲以建立數字延遲,或將其儲存在硬碟上進行數字錄製。

到目前為止一切都沒有任何問題,但由於我們聽不了數字訊號,所以必須將錄製或處理的數字資料轉換回可以透過揚聲器或耳機播放的模擬訊號。 因此,就需要數模轉換器將數字串轉換回一系列電壓電平。

到這兒也還沒結束,因為我們還需要將這一系列離散電壓平轉換成連續的波形。 我們將低通濾波器與數模轉換器配合使用,來對階梯訊號進行過濾,從而使尖銳的波形邊緣變得平滑(如圖2D所示),之後我們就可以將轉換好的模擬訊號傳送到放大器/揚聲器組合中了。

什麼是數模轉換器?它的工作原理是什麼?

為什麼數字音訊能夠保持保真度

我們以將數字訊號儲存在塑膠材質的圓盤上的光碟為例:當我們把光碟放進CD機後,鐳射就會讀取這些資料,然後將其傳送到數模轉化器,之後數模轉換器就會將數字訊號轉換回模擬訊號。 因為CD都帶有糾錯功能,所以即使光碟上有輕微的劃痕,它也能識別出來並對丟失的資料進行替換,因此通常不會有跳讀的情況發生。 在您下載音樂時,即使您的網際網路連線中斷了,下載引擎也會將這些部分組合成一個可以不間斷播放的檔案。

對音樂家來說,更重要的是,使用數字音訊可以讓音訊在透過訊號鏈後的音質保持不變。 在模擬多軌錄音機的時代,當您將您的歌曲混縮到一個模擬雙軌錄音帶時,會引入了額外的嘶嘶聲和失真。 當您對磁帶進行母版製作時,會引入更過的雜音,將音訊傳輸到一個可以壓制唱片的金屬壓模上時,也會引入砰砰聲、研磨聲和扭曲的聲音。 在每個音訊傳輸階段,訊號質量都會更加惡化。

使用數字錄音,您可以將數字訊號混合到立體聲或環繞立體聲中,從而建立另一組數字。 (當然,這些數字也會透過數模轉換器進行監聽,因此您可以聽到正在混縮的內容。)因此,最終的立體聲混音將代表您混縮歌曲時所聽到的內容。 接下來,您可以將透過數字化混合的數字串傳到網上(希望是無損的),或將其複製到智慧手機的記憶體中,或者將這些數字訊號壓入光碟,等等。

您可以在訊號鏈的最初想象模數轉化器把聲音“風乾”了起來,聲音直到回到播放系統的數模轉化器時才會被重構。 這也是數字音訊聽起來如此純淨的原因:它沒有遭受模擬訊號所遭受的那些修整。

什麼是數模轉換器?它的工作原理是什麼?

轉化器取樣率和解析度

是時候喝杯咖啡休息一下了,因為我們即將要說到的會涉及到更為晦澀的專業技術。但是大家一定要堅持看下去,因為接下來的內容非常重要。

轉換器的取樣率是由高精度、穩定的系統時鐘所控制的,是數字音訊系統最重要的特性之一。如果轉換器的取樣率比較高的話,那麼您也可以向下使用較低的取樣率,但如果轉換器的取樣率比較低的話,您卻不能使用較高的取樣率了。大多數低成本的轉換器的取樣率都是96kHz,不過隨著技術的發展,192kHz的取樣率在現代已經越來越普遍了。

轉換過程的另一個方面是位解析度(通常稱為字長),它表示的是模數轉化器測量輸入訊號的準確程度。 由於每個樣本在那個時刻都會測量訊號的電壓,因此測量越精確,從模擬音訊到數字資料的轉換就越準確。 就如同尺子的刻度一樣,以英寸為刻度的尺子只能只能確切地用英寸測量長度,但是,用十六分之一英寸刻度的尺子來測量長度的話,那麼解析度就可以提高16倍。 位數越高,解析度也就越高。

不同的音訊系統解析度也不盡相同。更高的解析度需要更多的儲存空間來儲存大量的數字訊號,以及更高的模數轉化器精確度來實現這些更高的解析度。隨著記憶體和轉換器變得越來越便宜,裝置們的位解析度也越來越高了。例如,音訊賀卡的音訊可能只有4位解析度。早期的數字音訊系統使用8位,後來發展到12位。 CD使用16位解析度,“高解析度”音訊使用24位解析度。雖然24位音訊檔案在相同取樣率下比16位音訊檔案多佔50%的儲存空間,但大多數錄音工程師都認為24位的音訊檔案要比16位音訊檔案的音質要好很多。(一個有趣的事實:也許人們最初認為CD聽起來比比黑膠唱片差的一個原因是,儘管CD具有16位解析度,但早期的播放器通常使用12位轉換器。)

位解析度越低,失真越大 - 如果你不能準確地測量一個訊號,那麼你就不能準確地再現它。然而,與物理世界(失真往往隨著訊號電平的升高而增加)中的失真不同,數字失真會隨著訊號電平的降低而增加,因為可用於表示音訊波形的位元非常少(如圖3所示)。

什麼是數模轉換器?它的工作原理是什麼?

圖3:高振幅解析度與低振幅解析度——對於固定解析度,如圖以24位為例,相比較低振幅訊號(右),您可以設定一個更高精度(位數更高)的高振幅訊號(左)

幸運的是,不管怎樣,失真在回放時的電平是非常低的,並且抖動也能進一步降低我們對低失真的感知。 此外,錄音/混音程式中的音訊引擎也不受轉換器硬體規則的約束,並且一旦訊號進入計算機內,就可以提供本質上無限的解析度。

為什麼數字轉換器的動態餘量很重要?

雖然您的軟體的音訊引擎具有幾乎無限的動態範圍,但處理進出您計算機的音訊的轉換器卻沒有。因此,我們要留出些動態餘量 - 訊號峰值與模數轉化器或數模轉化器可以處理的最大電平之間的電平差。例如,如果在您錄音時訊號的峰值在軟體的虛擬電平表上達到0,那麼說明音訊介面的轉換器中沒有更多的可用動態餘量。調高音訊介面的電平將產生失真。但如果訊號的峰值在軟體的虛擬電平表上顯示為-6dB,那麼就表示在失真前我們有6dB的動態餘量。在錄音時,許多工程師都會將數字音訊電平設定為低於0dBFS的6dB(或更低的峰值電平- 12db或- 15db也非常常見)。這可以適應意料之外的峰值,但是有些人也覺得這些電平達到了模數轉化器或數模轉化器的“最佳點”,在最高和最低電平時表現可能都不那麼好。

在混音時,主輸出要留有幾dB餘量的一個原因是,大多數數字測量儀測量的是數字音訊樣本的電平。但是,將數字音訊轉換回模擬可能會產生比樣本本身更高的電平值,這會造成樣本間失真(如圖4所示)。

什麼是數模轉換器?它的工作原理是什麼?

圖4A:正在被取樣的原始音訊

什麼是數模轉換器?它的工作原理是什麼?

圖4B:提高到0db後的最高取樣電平

什麼是數模轉換器?它的工作原理是什麼?

圖4C:經過平滑濾波器後,訊號超過0db

圖4:(A)中取樣的模擬音訊波形用紅點表示被測樣本電平。當透過平滑濾波器(C)重構模擬波形時,將數字音訊樣本的電平提高到最大可用動態餘量(B)可以超過數模轉換器的最大動態餘量(C)。 因此,(C)中曲線的紅色部分將被剪裁掉。

除非您通道的電平表具有能夠提醒您取樣間失真的功能,否則請留出幾dB的餘量來避免這種情況。 此外,您也不需要將電平調到最高,因為在現今的流媒體世界中,諸如YouTube和Spotify等都會調整音訊,使其達到一致的感知電平。

數字音訊的限制和解決方案

當CD第一次出現的時候,它的宣傳口號是“永遠完美的聲音”—一個誰都會喜歡的營銷口號。然而,雖然數字音訊總體上要比模擬音訊好,但它仍不是完美的。

取樣率問題

如果系統不能以足夠高的取樣頻率對訊號電平進行取樣的話,就很難準確地再現訊號。取樣率必須至少是進入系統的最高音訊頻率的兩倍,因此44。1kHz是錄音的最低的取樣率。

輸出濾波器音染。如上所述,post-DAC低通濾波器會將階梯取樣轉換為平滑連續的訊號。 但是,濾波器可能會新增自己的音染。

解析度(量化)錯誤

如果數字音訊系統能夠以1毫伏(mV或1/1000伏特)的精度測量電平,則1mV的電平將被指定為一個數字,2mV的電平將被指定為一個數字,3mV的電平將指定為一個數字,以此類推。 現在假設計算機試圖測量1。5mV訊號 - 計算機無法解析該值,因此它必須指定一個1mV或2mV的值。 在這兩種情況下,樣本與原始輸入電平都不能完全對應,這就會產生錯誤。雖然實際的精確度要比這個例子好得多,但是仍然有可能出錯。

非線性

非線性是用來描述如果不同的量化級別之間的間隔不是均等的,那麼就會出現誤差的情況。讓我們回顧下前面的例子,我們假設能夠測量到1毫伏的精度。回到前面的例子,我們假設能夠測量到1毫伏的精度。但如果存在非線性,轉換器可能會將1毫伏訊號轉換為1。001毫伏,2毫伏訊號轉換為1。978毫伏,等等。這些誤差會改變波形形狀,從而導致失真。

動態範圍限制

從理論上講,24位解析度具有大約144dB的動態範圍(每位大約6dB)。但在現實世界中,由於噪聲,電路板佈局問題,電源限制和製造公差等因素的影響,24位的轉換超出了轉換器解決高動態範圍的能力,所以實際解析度更可能是20到22位。

抖動

如果提供取樣率的系統時鐘不穩定,則不會以相同的時間間隔捕獲或回放表示數字音訊的樣本。您可以將其視為“時間失真”,因為您沒有在正確的時間聽到正確的樣本。這會導致細微的失真,這也是在兩個不同的數模轉換器上回放相同的數字音訊可能聽起來不同的原因之一 —— 一個可能具有更高的抖動,而另一個具有更低的抖動。

偏移和增益誤差

即使沒有輸入電平,偏移也會產生輸出電壓。高階的轉換器在加工完成後,通常還會對轉換器的內部電路進行修整以消除偏移。當輸出電壓高於或低於理論上的值時,轉換器也可能存在增益誤差。對於這些問題,目前並沒有什麼好的解決方法,但是人們在設計高階的轉換器時,通常會在最小化電壓偏移和增益誤差上下很大功夫。

雖然數字音訊可能並不完美,但它確是最接近完美的 - 並且還在不斷改進。然而,僅僅因為某些東西是“數字的”並不意味著您能享受到數字音訊所有的優勢。智慧手機或其他消費類裝置中的轉換器與專用音訊轉換器是不在一個級別上的。

例如,Dangerous Music的Convert-8是一款高階的8通道數模轉換器,具有良好的規格引數:114dB動態範圍(信噪比),總諧波失真+噪聲(unweighted) 0。00188%at + 4dBu,低於0。0004%at + 22dBu,串擾抑制(從一個通道洩漏到另一個通道)在1kHz時超過114dBu,時鐘抖動低於16微微秒(從100Hz到40kHz)。如果您不知道這些規格的真正含義的話,只需說它們非常棒就足夠了。但請注意,雖然這些引數都是非常明確的,但並非所有公司都會如此嚴格的規範。例如,它們可能會產生串擾,但哪個頻率產生串擾的可能性最低就沒有在引數表裡提及,所以最重要的是要用耳朵去聽,而不是用眼睛去看。

什麼是數模轉換器?它的工作原理是什麼?

好在現代的轉換器晶片的質量要遠遠優於80年代和90年代。 即使是低成本的音訊介面也會有可觀的規格引數,所以我們在現在很難能找到“糟糕”的專業音訊介面,但如果您有足夠的預算來購置高階的轉換器的話,那麼您就能得到開放度更高、聲音更通透、更具空氣感的聲音。 雖然數字音訊優勢多多,但它還是要在模擬世界來回轉換 - 而這也是用來區分高階轉換器與“所謂好的”轉換器的關鍵。

想要了解更多音訊相關資訊,歡迎訪問米飯星網站及米飯星公眾號