870920 Menu

Cool Edit Pro操作详解·67

9.6 数字音频

数字音频采用数字化方式来处理音频信号,它具有频率响应宽、噪声小、动态范围大、不受外界干扰、便于传播、工作可靠性高、能永久性保存等优点。由于大规模集成电路及计算机技术日新月异的普及与推广,数字信号处理在音频领域的应用得到了飞速发展,各种数字音频硬件和软件层出不穷。目前,国内外对数字音频的介绍文章与参考资料非常多,一些常识性概念与基本原理也都讲解的非常清楚了,这些内容,本章不再重复,或者一带而过,只对某些比较生疏或其他作者介绍较少的内容进行简述。

音频信号是一种模拟信号,即在时间上该信号是连续的,其幅度可在一连续范围内取任意数值。数字信号则以一个数的序列来表示,即在时间上是离散的。由于一个数只能取有限位的数码,因此它只能用一组数值来表示,而不能取连续范围内的任意数值。

当我们用数字方式处理音频信号时,首先要将被处理的模拟信号转换为数字信号,而后对这些与模拟信号相对应的数字信号进行处理,最终将处理后的数字信号再转换为模拟信号。当用二进制数码来表示模拟波形的各项属性时,会产生量化误差,在量化前对波形进行抖动处理,可以将这种误差减到最小。这个过程中,最关键的是采用时间取样和幅度量化的方式对音频信号进行数字化转换,这两种方式,是整个数字音频的最根本原理与基础。

•离散时间取样:以最常见的时间为例,它在连续不断的流逝。当时间流逝时,模拟时钟的指针扫过钟面,相当于经过了钟面上的每一个点,也就是无穷多的“点”,而数字时钟则显示一个个的数值,用来代表当前的时间,相当于取样时间。与此类似,声音在时间上是连续变化的,它也可以用连续或离散这两种方式来记录和再现。

只要满足正确的条件,在数字化系统中,取样不会造成信息的丢失,取样前的信号与取样后的信号含有相同的信息量。要做到这一点,只要求输入信号满足一定的条件即可,这就必须对信号进行滤波处理,把不适合取样的频率成分过滤掉。也就是说,具有有限频率响应的信号能够无损失地被取样。在技术方面,可以通过一段长的区间上对函数进行取样并求出均值这种办法来实现。

1920年,日本科学家K.Ogura证明,如果一个函数以其最高频率两倍的取样频率进行取样,则取样后的函数中含有原函数的所有信息,并能从取样中重建原函数。同年,美国工程师John Carson对此结论做了实际应用中的验证。离散时间取样有几个常用的概念和知识点:取样定理、奈奎斯特频率、混叠,本书对此不做深入讲解。

•量化:在音频系统中,量化是对取样时刻的音频信号数值的计量,取样和量化分别决定了系统的带宽和分辨率这两个特性参数。通过量化,将模拟的波形表示成一系列脉冲,用脉冲所代表的数字来表示取样时刻波形的模拟值。不过,在量化的过程中会引入误差。这种误差类似于模拟音频系统中的噪声,被称为量化噪声。在均匀量化中,一个模拟信号的幅度被映射成一些有相等间隔的量值。

将模拟波形上的无限多的幅度值用有限多的量化电平来表示,这就引入了误差,高质量的表示需要大的电平数。同时,模拟波形具有无限个幅度值,而一个量化器只有有限数目的电平间隔。在两个间隔中的所有模拟值都只能表示成一个代表这一电平间隔的数字,所以量化值只是实际值的近似,而不是绝对相等。量化有几个比较重要的知识点:信号误差比、量化失真。

•抖动:对于幅度大的复杂信号,信号与量化误差之间的相关性很小,其误差是随机的,可以看成类似于模拟信号中的白噪。对于幅度小的信号,当误差变得与信号相关时,误差的特性就发生了改变,可以使量化误差减小6dB,但这是相当不经济的。此时,采用抖动技术就非常有必要了。可以根据概率密度函数的不同将抖动分类为高斯型、矩形(均匀分布)、三角型。

抖动是一种十分有效的技术,它的信号是一种噪波,与音频信号不相关,抖动信号在取样之前加入到音频信号中。在量化过程中,由于抖动信号的存在,音频信号将根据量化电平来移位。它不再是周期性出现的连续波形的量化形式,其每一个周期都不相同,这样便可消除量化误差与信号的相关性。从某些方面来说,抖动的功能类似于模拟磁带记录中的高频偏磁。一个进行了恰当抖动的数字系统远远超过一个模拟系统的信噪比,但需要注意的是,抖动并不能掩盖量化噪声。

下面我们看看数字音频的记录与再现。说到这个话题,就不能不提信号的调制与纠错。调制是将一种特定信号变换成其它形式信号的技术,为了传送或记录数字信号,必须对其进行调制。调制的方式大致可分为两种类型,一类是为连续波参量调制,比如AM(调幅)、FM(调频)、PM(调相);另一类是脉冲参量调制,比如PAM(脉冲幅度调制)、PWM(脉冲宽度调制)、PPM(脉冲相位调制)、INM(脉冲数量调制)、PCM(脉冲编码调制)。数字音频系统中较多采用的是PCM。这种调制方式要求有较高的数据传输率和较高的记录密度,当信号的采样频率和数字信号的位数决定之后,其数据传输率即被确定。

数据在传输和记录的过程中,因外界干扰、传输设备或记录媒质的原因,有可能使数值发生变化,即产生误码,此时需要检错和纠正。为了完成这个过程,需要在原数据的基础上另外附加用于检错和纠正的信息,这些信息称为检验字。纠正错码,有反馈重传、前向纠错、多组筛选等三种方式,数字音频系统通常采用前向纠错方式。在进行纠错处理时,往往还要用到交织、误码插补等技术。

模拟信号转换为二进制数字后,还要进行几步处理才能将得到的数据存储到媒质上,或进行传输。PCM系统的做法通常是依次进行多路数据复用,加入纠错码,完成交织,输出信道编码等等。

•A/D转换:将模拟信号(Analog)转换为数字信号(Digital)的过程称为A/D转换,也称为模数转换。是数字音频系统的核心部分。其中,取样保持、量化、编码和抖动处理是A/D转换的基本功能。与之对应,D/A转换则是数字信号转换为模拟信号,通常用于数字音频信号的输出和再现(数模转换)。

•浮点系统:一种改进的可接受幅值缩放的PCM系统,采用具有非均匀量化级的自适应方法,可分为真浮点系统(缩放因子对取样值进行实时处理)和块浮点系统(处理块数据)。浮点系统不产生线性数据,它使用非线性量化的办法,输出数据分为两部分,即底数部分(数据值)和指数部分(缩放因子),底数部分代表输入信号的波形大小,缩放后的波形幅度由指数部分决定。也可以理解为:指数部分用于调节波形的增益大小。

•差分PCM:即DPCM,它与线性或非线性系统不同,记录的不是信号的绝对大小,而是相对大小。信号相对大小的变化通常比信号本身要小,码位占用也少。模拟信号的平均值从一个样值到另一个样值的改变是很小的,如果取样频率足够高,大多数连续的样值之间会有很大的相关性。差分系统就是利用这种信息的冗余,不记录信号的大小,而是记录相邻样值之间的差值。差分编码普遍采用预测编码技术,从输入中减去预测值,而后对预测误差进行量化,最终的编码就是预测值与实际值的差值。

•数字滤波器:对输入样值进行滤波处理的一种算法,具有低通滤波器的特性,并提供波形重建功能。模拟滤波器过滤掉在样值转换为模拟信号时产生的高频成分,数字滤波器在D/A转换之前完成相同功能。在D/A转换后,用一个低阶的具有缓和下降边沿的低通滤波器除去频率很高的部分。大多数情况下,数字音频采取FIR(有限脉冲响应)滤波技术。

•感知编码:数据压缩编码的一种类型。我们知道,任何数据压缩的目的都是为了降低数据传输速率,虽然降低取样频率也可以降低数据传输速率,但取样定理限制了取样频率的降低。另一种方法是减少字长,这样做的副作用是音频信号的动态范围每字节减小6dB,而且增加了量化噪声。比较可行的方法是利用声学心理学模型,在取样频率不变的前提下,使用感知编码技术进行数据压缩,根据信号的实际情况有选择地减少字长,并通过掩蔽及其它方法尽可能减少增加的量化噪声。

感知编码首先分析输入信号的频率与振幅,然后将其与人的听觉感知模型进行比较,并使用此模型去除音频信号总的不相干部分及统计冗余部分。尽管这个办法是有损的,但是人耳基本感觉不到差别,音质方面能得到最大限度的保证,从而提高编码的效率并减少数据传输速率。