数字音频能否超越模拟?
已发表: 2022-06-03 自从光盘问世以及它带来的数字音频的广泛消费者访问以来,人们一直在争论数字音频是否能够充分取代其模拟前辈。
随着可下载和流媒体数字格式的普及和复杂性的增加,讨论只会扩大,许多顽固的模拟“纯粹主义者”谴责他们认为现代数字音频格式明显缺失的音乐灵魂的丧失。
但我不是来反对或支持纯粹主义者的。 相反,让我们探讨数字声音可以等于甚至超过模拟声音的场景的要求。 问题的答案是,“数字音频能胜过模拟吗?” 实际上有两个部分。
我们即将踏入数学和科学的世界,所以抓住你的帽子!
连续与离散信号
首先,重要的是要准确了解模拟声音和数字声音之间的区别。
模拟声音利用不断变化的音频信号; 这意味着从其信号馈送到扬声器的压力波动(至少在理想情况下)是每个时刻原始声音的精确再现。
另一方面,数字声音由其音频信号中的一系列离散步骤组成,这些步骤变化得足够快,以至于当馈送到扬声器时它们会产生连续信号的错觉。 这与由一系列静止图像制作视频的方式非常相似,这些静止图像的循环速度足够快以产生平滑运动的错觉(因此最初的短语“运动图片”)。
因此,实际上,数字声音试图逼近模拟声音的连续信号。 如果数字声音中的离散步进变化足够频繁,并且如果这些步进本身能够在电平上足够接近,那么所得到的近似值就足够接近连续的模拟信号,它可以欺骗我们的耳朵和大脑。
信号分辨率
数字声音信号中离散步骤的循环速度称为采样率。 每个步骤之间的级别差异由潜在步骤的总数决定,称为位深度。
例如,CD 音频文件的采样率为 44,100Hz(Hz 代表赫兹,它是描述事件每秒重复多少次的测量单位——意味着它每秒产生 44,100 个新的音频信号步长)和一点16 位的深度(每个位是一个二进制数字,因此 16 位数字信号总共有 2 的 16 次方,或者在其最小值和最大值之间有 65,536 个可能的数值)。
这种 CD 音频值的选择并非巧合。 根据称为奈奎斯特定理的公式,这个 44,100Hz 的采样率是产生音调覆盖典型人类听力全范围的声音所需的最低要求。 并且 16 位的比特率是可以轻松使用的最大比特率,并且仍然适合标准光盘上的合理数量的声音材料。
您可以说,由于数字离散信号只是实际声音的近似值,因此无论它有多好,它都永远不会完全匹配实际精确的连续模拟信号,因此这应该是争论的结束。 然而,问题仍然在于人脑是否真的能分辨出差异,尤其是对于更高分辨率的数字音频。
这是神经科学家的问题,因此出于我们的目的,我们将完全避免讨论,而是提出一个问题: “模拟媒体源是否真的首先会产生真正的连续音频信号?”
模拟媒体
让我们考虑最常见的模拟媒体格式,即黑胶唱片。 黑胶唱片具有特定的材料特性,这些特性决定了它的行为方式、能力以及局限性。 此外,转盘(电唱机)也有其自身的材料特性、功能和限制。
黑胶唱片通常由半刚性形式的 PVC 或聚氯乙烯制成。 模拟信号直接刻在唱片的凹槽中,从而使 PVC 材料响应信号而变形。 在唱机上使用一根针来“读取”这些微观变形,从而再现产生它们的原始信号。
乙烯基材料 PVC 具有与其分子和晶体结构相关的最小尺寸,这实际上意味着记录凹槽内材料的变形不能改变到比其物理特性允许的更精细的尺度。 因此,从本质上讲,它并不能真正产生完美连续的信号,而是该信号的近似值,受乙烯基材料本身的特性限制。
您不能在唱片的凹槽内切出小于 PVC 材料最小分子尺寸的切口——单个氯乙烯单体(也称为氯乙烯分子)。
黑胶唱片的信号分辨率
用于制作黑胶唱片的 PVC 的密度约为每立方厘米 1.3 克。 单个氯乙烯单体(一个氯乙烯分子)的质量约为 1.07x10 -22克。 这意味着在乙烯基 LP 中 1 立方厘米的 PVC 空间内有类似 12.1x10 21个单独的氯乙烯分子。 我们可以从一侧切下的这种材料的最小条是一个分子厚,我们现在可以估计其厚度约为 4.4x10 -8 cm。

黑胶唱片中的凹槽最大可雕刻约 0.008 厘米宽,凹槽的一半与左声道相关,另一半与右声道相关。 这意味着针可以感觉到每个通道的最大位置变化高达 0.004 厘米。
因此,为了形成每个通道的最大凹槽尺寸变化,我们可以去除的最大分子切片数量约为 91,000。 这遵循与数字音频信号的位深度相同的原则。
此外,由于唱片在转盘上的旋转速度、唱片的直径以及切入唱片的各个凹槽的宽度,可以看出有大约 45,000 厘米的总凹槽长度可供雕刻输入(在记录的每一侧)的信号,如果全部填充,则以正确的播放速度在大约 1400 秒的总时间内播放。
因此,我们可以估计在 LP 一侧的完整播放期间,针平均每秒通过大约 7.3 亿个单独的氯乙烯分子。 这遵循与数字音频信号采样率相同的原则。 它告诉我们可以再现的最小步长,近似于原始音频信号随时间的变化。
比较信号分辨率
因此,通过一些估计方法(过于简单,但在一般意义上有效),我们可以看到黑胶唱片对连续音频声音信号产生的离散近似值与位深度至少为 16 位和样本的数字信号相同730MHz的速率。
但是,暂时不要太兴奋。 您不能简单地将所有数字 WAV 和 MP3 文件转换为 17 位、730MHz 的音频文件,然后告诉所有人它们和黑胶唱片一样好。 您对真正连续音频信号的近似值,无论是通过模拟方式还是数字方式,都必须在整个过程中保持在其最大分辨率,才能说它符合该标准。
大多数模拟设备会这样做,但大多数数字设备不会。 一旦您使用的数字方法低于与 LP 匹配的最低标准,您的近似值的准确性就会降低。 以后任何向上转换到更高的分辨率只会更好地再现您在生产过程中应用的最不准确的近似值。
此外,虽然现在很容易获得 24 位和 32 位数字录音,大大超过了黑胶唱片的有效位深度,但现实情况是,即使是当今大多数人可用的最好的数字录音设备,其最大采样率也只有 192kHz,这比要跟上乙烯基的有效采样率所需的速度慢近 4,000 倍。
因此,对于我们问题的第一部分,处理模拟声音与数字声音的技术比较,答案是:是的,理论上数字声音可以胜过模拟声音。 现代数字声音的技术潜力在位深度方面超过了模拟声音,但在采样率方面(目前)远远低于模拟声音。
生产链中的模拟风味
问题的第二部分是关于最终产品的实际声音。 换句话说,假设在未来的某个时间点,该技术允许数字音频达到我们计算出的 730MHz 或更好的采样率,这是匹配黑胶唱片的有效采样率所需的。 那时,由于数字音频的技术潜力可以达到或超过模拟音频的技术潜力,那么数字声音会与模拟一样好还是更好?
要回答这个问题,重要的是要认识到人们喜欢来自黑胶唱片的声音很大程度上是由于录音和混音中使用的模拟制作设备及其特殊的声音风味。
近年来,数字建模已经变得非常好,可以匹配许多人们喜欢的经典模拟声音。 当然,该技术还需要在整个过程中保持相同的最大声音分辨率。
但是,可以肯定地说是的——假设数字音频最终将实现与当前模拟方法相同的声音再现技术潜力,并在整个制作过程中保持该分辨率,并使用模拟设备或模拟设备的数字建模在首选声音调味的过程中——数字音频在技术质量和声音偏好上应该能够达到或超过模拟声音的性能。
实用性
讨论完毕? 好吧,让我们看看最后一个考虑因素。
让我们想象一下,整个过程以数字格式完成,达到或高于匹配模拟的技术标准,并在该标准下使用模拟建模效果。 如果我们制作一个三分钟录音的全品质原始 WAV 音频文件,该级别的数字文件大小几乎是相同长度的 CD 音频质量 WAV 文件的 18,000 倍,给它一个文件一首短歌的大小超过 500Gb。
鉴于这个庞大的文件大小问题,以及当前的数字采样率远远达不到满足模拟声音标准的要求,显然黑胶唱片仍然是一个不错的选择。
然而,随着数字播放系统的普及、数字声音技术的不断进步,以及在完全虚拟的环境中维护媒体的选项,不需要存储大型黑胶唱片和特殊设备来播放它,这可能只是数字声音最终明确超越模拟声音只是时间问题。
创建您自己的音乐网站,该网站适合移动设备且随时易于更新! 立即使用 Bandzoogle 构建网站。
---
Erik Veach 是 Crazy Daisy Productions 的所有者和首席音频工程师,自 2001 年以来提供混音、母带和声音编辑服务。他是自动化智能母带系统的最初先驱,并于 2003 年将其引入专业音乐制作。