數字音頻能否超越模擬?

已發表: 2022-06-03

數字音頻能否超越模擬? 自從光盤問世以及它帶來的數字音頻的廣泛消費者訪問以來,人們一直在爭論數字音頻是否能夠充分取代其模擬前輩。

隨著可下載和流媒體數字格式的普及和復雜性的增加,討論只會擴大,許多頑固的模擬“純粹主義者”譴責他們認為現代數字音頻格式明顯缺失的音樂靈魂的喪失。

但我不是來反對或支持純粹主義者的。 相反,讓我們探討數字聲音可以等於甚至超過模擬聲音的場景的要求。 問題的答案是,“數字音頻能勝過模擬嗎?” 實際上有兩個部分。

我們即將踏入數學和科學的世界,所以抓住你的帽子!

連續與離散信號

首先,重要的是要準確了解模擬聲音和數字聲音之間的區別。

模擬聲音利用不斷變化的音頻信號; 這意味著從其信號饋送到揚聲器的壓力波動(至少在理想情況下)是每個時刻原始聲音的精確再現。

另一方面,數字聲音由其音頻信號中的一系列離散步驟組成,這些步驟變化得足夠快,以至於當饋送到揚聲器時它們會產生連續信號的錯覺。 這與由一系列靜止圖像製作視頻的方式非常相似,這些靜止圖像的循環速度足夠快以產生平滑運動的錯覺(因此最初的短語“運動圖片”)。

因此,實際上,數字聲音試圖逼近模擬聲音的連續信號。 如果數字聲音中的離散步進變化足夠頻繁,並且如果這些步進本身能夠在電平上足夠接近,那麼所得到的近似值就足夠接近連續的模擬信號,它可以欺騙我們的耳朵和大腦。

離散與連續 信號分辨率

數字聲音信號中離散步驟的循環速度稱為採樣率。 每個步驟之間的級別差異由潛在步驟的總數決定,稱為位深度。

例如,CD 音頻文件的採樣率為 44,100Hz(Hz 代表赫茲,它是描述事件每秒重複多少次的測量單位——意味著它每秒產生 44,100 個新的音頻信號步長)和一點16 位的深度(每個位是一個二進制數字,因此 16 位數字信號總共有 2 的 16 次方,或者在其最小值和最大值之間有 65,536 個可能的數值)。

這種 CD 音頻值的選擇並非巧合。 根據稱為奈奎斯特定理的公式,這個 44,100Hz 的採樣率是產生音調覆蓋典型人類聽力全範圍的聲音所需的最低要求。 並且 16 位的比特率是可以輕鬆使用的最大比特率,並且仍然適合標準光盤上的合理數量的聲音材料。

您可以說,由於數字離散信號只是實際聲音的近似值,因此無論它有多好,它都永遠不會完全匹配實際精確的連續模擬信號,因此這應該是爭論的結束。 然而,問題仍然在於人腦是否真的能分辨出差異,尤其是對於更高分辨率的數字音頻。

這是神經科學家的問題,因此出於我們的目的,我們將完全避免討論,而是提出一個問題: “模擬媒體源是否真的首先會產生真正的連續音頻信號?”

模擬媒體

讓我們考慮最常見的模擬媒體格式,即黑膠唱片。 黑膠唱片具有特定的材料特性,這些特性決定了它的行為方式、能力以及局限性。 此外,轉盤(電唱機)也有其自身的材料特性、功能和限制。

唱片槽

黑膠唱片通常由半剛性形式的 PVC 或聚氯乙烯製成。 模擬信號直接刻在唱片的凹槽中,從而使 PVC 材料響應信號而變形。 在唱機上使用一根針來“讀取”這些微觀變形,從而再現產生它們的原始信號。

乙烯基材料 PVC 具有與其分子和晶體結構相關的最小尺寸,這實際上意味著記錄凹槽內材料的變形不能改變到比其物理特性允許的更精細的尺度。 因此,從本質上講,它並不能真正產生完美連續的信號,而是該信號的近似值,受乙烯基材料本身的特性限制。

您不能在唱片的凹槽內切出小於 PVC 材料最小分子尺寸的切口——單個氯乙烯單體(也稱為氯乙烯分子)。

黑膠唱片的信號分辨率

用於製作黑膠唱片的 PVC 的密度約為每立方厘米 1.3 克。 單個氯乙烯單體(一個氯乙烯分子)的質量約為 1.07x10 -22克。 這意味著在乙烯基 LP 中 1 立方厘米的 PVC 空間內有類似 12.1x10 21個單獨的氯乙烯分子。 我們可以從一側切下的這種材料的最小條是一個分子厚,我們現在可以估計其厚度約為 4.4x10 -8 cm。

黑膠唱片中的凹槽最大可雕刻約 0.008 厘米寬,凹槽的一半與左聲道相關,另一半與右聲道相關。 這意味著針可以感覺到每個通道的最大位置變化高達 0.004 厘米。

因此,為了形成每個通道的最大凹槽尺寸變化,我們可以去除的最大分子切片數量約為 91,000。 這遵循與數字音頻信號的位深度相同的原則。

此外,由於唱片在轉盤上的旋轉速度、唱片的直徑以及切入唱片的各個凹槽的寬度,可以看出有大約 45,000 厘米的總凹槽長度可供雕刻輸入(在記錄的每一側)的信號,如果全部填充,則以正確的播放速度在大約 1400 秒的總時間內播放。

因此,我們可以估計在 LP 一側的完整播放期間,針平均每秒通過大約 7.3 億個單獨的氯乙烯分子。 這遵循與數字音頻信號採樣率相同的原則。 它告訴我們可以再現的最小步長,近似於原始音頻信號隨時間的變化。

比較信號分辨率

因此,通過一些估計方法(過於簡單,但在一般意義上有效),我們可以看到黑膠唱片對連續音頻聲音信號產生的離散近似值與位深度至少為 16 位和样本的數字信號相同730MHz的速率。

但是,暫時不要太興奮。 您不能簡單地將所有數字 WAV 和 MP3 文件轉換為 17 位、730MHz 的音頻文件,然後告訴所有人它們和黑膠唱片一樣好。 您對真正連續音頻信號的近似值,無論是通過模擬方式還是數字方式,都必須在整個過程中保持在其最大分辨率,才能說它符合該標準。

大多數模擬設備會這樣做,但大多數數字設備不會。 一旦您使用的數字方法低於與 LP 匹配的最低標準,您的近似值的準確性就會降低。 以後任何向上轉換到更高的分辨率只會更好地再現您在生產過程中應用的最不准確的近似值。

此外,雖然現在很容易獲得 24 位和 32 位數字錄音,大大超過了黑膠唱片的有效位深度,但現實情況是,即使是當今大多數人可用的最好的數字錄音設備,其最大採樣率也只有 192kHz,這比要跟上乙烯基的有效採樣率所需的速度慢近 4,000 倍。

因此,對於我們問題的第一部分,處理模擬聲音與數字聲音的技術比較,答案是:是的,理論上數字聲音可以勝過模擬聲音。 現代數字聲音的技術潛力在位深度方面超過了模擬聲音,但在採樣率方面(目前)遠遠低於模擬聲音。

生產鏈中的模擬風味

問題的第二部分是關於最終產品的實際聲音。 換句話說,假設在未來的某個時間點,該技術允許數字音頻達到我們計算出的 730MHz 或更好的採樣率,這是匹配黑膠唱片的有效採樣率所需的。 那時,由於數字音頻的技術潛力可以達到或超過模擬音頻的技術潛力,那麼數字聲音會與模擬一樣好還是更好?

要回答這個問題,重要的是要認識到人們喜歡來自黑膠唱片的聲音很大程度上是由於錄音和混音中使用的模擬製作設備及其特殊的聲音風味

近年來,數字建模已經變得非常好,可以匹配許多人們喜歡的經典模擬聲音。 當然,該技術還需要在整個過程中保持相同的最大聲音分辨率。

但是,可以肯定地說是的——假設數字音頻最終將實現與當前模擬方法相同的聲音再現技術潛力,並在整個製作過程中保持該分辨率,並使用模擬設備或模擬設備的數字建模在首選聲音調味的過程中——數字音頻在技術質量和聲音偏好上應該能夠達到或超過模擬聲音的性能。

實用性

討論完畢? 好吧,讓我們看看最後一個考慮因素。

讓我們想像一下,整個過程以數字格式完成,達到或高於匹配模擬的技術標準,並在該標準下使用模擬建模效果。 如果我們製作一個三分鐘錄音的全品質原始 WAV 音頻文件,該級別的數字文件大小幾乎是相同長度的 CD 音頻質量 WAV 文件的 18,000 倍,給它一個文件一首短歌的大小超過 500Gb。

鑑於這個龐大的文件大小問題,以及當前的數字採樣率遠遠達不到滿足模擬聲音標準的要求,顯然黑膠唱片仍然是一個不錯的選擇。

然而,隨著數字播放系統的普及、數字聲音技術的不斷進步,以及在完全虛擬的環境中維護媒體的選擇,不需要存儲大型黑膠唱片和特殊設備來播放它,這可能只是數字聲音最終明確超越模擬聲音只是時間問題。

創建您自己的音樂網站,該網站適合移動設備且隨時易於更新! 立即使用 Bandzoogle 構建網站。

---

Erik Veach 是 Crazy Daisy Productions 的所有者和首席音頻工程師,自 2001 年起提供混音、母帶和聲音編輯服務。他是自動化智能母帶系統的最初先驅,並於 2003 年將其引入專業音樂製作。