Page 55 - BP_201809
P. 55
中,信息难免会有损失,因为整个拾音、传输、放音是一个连 数据的统计学原理,进行数据压缩,可以完全恢复原始数据。
续的过程,所以只要一有损失或干扰,听众就会有很直观的感 无损音频压缩编码虽然没有减少信息量,但压缩比较低,一般
受;这个缺点同时也存在于音频存储过程。所以模拟音频的缺 可实现1.5:1至3.5比1的比特率压缩,取决于信息的复杂度。
点在于,抗干扰能力差。因此后续的技术在声音的传输之前和 较为常见的无损压缩编码有Huffman 哈夫曼编码。其主要统计
之后各加入了一个环节,即数模转换和模数转换,因此前文讨 最频繁出现的信息,分配这类信息较低的比特;同时分配最不
论的过程变为拾音-模数转换-传输-数模转换-放音,这个过 频繁出现的信息较多的比特,这样可以减低整个信息的平均码
程的作用是将模拟信号转换为数字信号,这其中已经涉及了音
长,达到数据压缩的目的。
频编码,加入这两个环节的优点在于数字信号是不连续的、而
·有损压缩编码
且是电压值得判断,可以承受一定的损失,抗干扰能力强。随
有损压缩编码的主要原理是消除音频中的冗余信息,虽然
着网络技术的发展,音频开始在网络中传输,这又产生了新的
是冗余信息,但也包含了一定的信息量,因此有损压缩编码对
问题,传统的数字信号在网络中传输占用很大的带宽,为了解
音频有信息损失,压缩比越高,损失越大。数字音频信号中的
决这个问题,产生了一系列压缩编码技术,将音频中的冗余信
冗余可以分为时域冗余,频域冗余和听觉冗余。有损压缩编码
息去掉,减少了数据量,使音频信号可以在网络中传输。本文
就是去掉以上冗余信息,实现音频压缩的目的。其中时域冗余
以下要讨论音频的数模转换过程,和音频压缩编码的原理,对
包括幅度冗余,即小幅度信号针对动态范围的数据位闲置;也
比目前主流的音频编码技术,探讨在广电领域中音频编码技术
包括时域上相邻信号间的相似性,可以通过相似信号的差值表
的应用。
达压缩数据,同时还包括信号周期的相关性。频域冗余主要表
现为功率谱密度的非均匀性,即大部分音频低频的能量分布高
二.音频压缩编码技术探讨
于高频的能量分布。听觉冗余是主要的压缩依据,其主要原理
1.模数转换
模数转换是将模拟信号转换为数字信号的过程,该过程分 是通过人耳的听觉特征,设计心理学模型,去掉音频中人耳无
为采样、量化和编码三部分。采样过程是将连续的模拟电信号 法感受到的音频信息,实现音频压缩的目的。应用最广泛的是
变为离散的数字电信号的过程,即在1秒内多次记录模拟电信 利用人耳的掩蔽效应,如下图1所示,人耳掩蔽效应是指在一
号的幅度值,形成多个离散的幅度值,1秒内记录的次数为采 个频率上较强的声音可以掩盖对其周边频率内的声音,被掩蔽
样率,一般广播信号的采样率为48kHZ或44.KHZ,即每秒采 的声音本来是可闻的,但是由于有掩蔽声音的存在,变得不可
样48000次或44100次。采样后,每个幅度值需要经过量化转换 闻。掩蔽声音对其周边频率形成的掩蔽阈值曲线,低于掩蔽曲
为可以用数字信号表达的值,量化即对幅度值进行分割,将无 线下的声音都被掩蔽,在音频压缩中可以去除掉。以上是频域
限多个幅度信号取值分割为有限个取值。分割完成后,编码部 掩蔽,时域掩蔽是指一个瞬时强音会对其前段时间和后段时间
分就是将分割的幅度值,进行表达,即用二进制的形式记录每 的弱音造成掩蔽,使其不可闻。
一个经过采样和量化的幅度值,形成二进制编码。在量化过程
中,对幅度值得分割越精细,二进制编码中采用的位数越多,
一般广播信号采用24位或者16位的位数记录音频信号的幅度
值,即经过采样的音频信号的幅度值可以有2的24次方或者16
次方种表示。以上过程就是模拟信号转换为数字信号的过程,
在声音播放时,通过逆过程将数字信号转换为模拟信号进行播
放。以上的编码过程称为脉冲编码调制PCM(Pulse Coding
Modulation)技术。可以发现运用该技术对音频质量有两个关
键的影响点,即采样率和量化位数,采样率越高、量化位数越
多,音频的本身包含的信息量越多,但同时数据量越大。一般
CD音质均用16位的量化编码,44.1kHZ的采样率,立体声声
道,其1s的数据量为44.1k*16*2=1.411M,即1.41Mbit/s,这
种数据量在网络传输中会占用较大的带宽,实用性差,因此后
图1
续发展的音频编码技术致力于降低音频中的数据量,为音频压
大部分低码率的压缩算法,充分利用了人耳的掩蔽效
缩编码。
2.音频编码技术原理 应,如子带编码。子带编码通过滤波器将音频分为多个子带,
音频压缩编码分为有损压缩编码和无损压缩编码。 计算每个子带内的平均声级和掩蔽声级,对比心理学模型,确
·无损压缩编码 定量化位数,保证量化噪声不可闻,并将量化比特分配给可闻 WWW.IMASCHINA.COM
无损压缩编码并没有减少音频中的信息量,其主要是根据 的音频。
55