(1)时域压缩(波形编码)技术是指直接针对音频PCM码流的样值进行处理,通过静音检测、分线性量化、差分等手段对码流进行压缩。此类的压缩技术的共同特点是算法复杂度较低,声音质量一般,压缩比例小,编解码延时最短(相对其它的技术)。此类压缩技术一般多用于语音压缩,低码率应用(源信号带宽小)的场合。时域压缩技术主要包括G.711、ADPCM、LPC、CELP、以及在这些技术上发展起来的块压扩技术如NICAM、子带ADPCM(SB-ADPCM)技术如G.721、G.722、Apt-X等。
(2)子带压缩技术是以子带编码理论为基础的一种编码方法。子带编码理论最早是由Crochiere等于1976年提出的。其基本思想是将信号分解为入肝子频带内的分量之和。然后对个子带分量根据其不同的分布特性采取不同的压缩策略以降低码率。通常的子带压缩技术和变换压缩技术都是根据人对声音信号的感知模型(心里声学模型),通过对信号频谱的分析来决定子带样值或频域样值的量化阶数和其它参数选择的,因此又可称为感知型(perceptual)压缩编码。这两种压缩方式相对时域压缩技术而言要复杂得多,同时编码效率、声音质量也大幅提高,编码延时相应增加。一般来讲,子带编码的复杂度要略低于变换编码,编码延时也相对较短。
由于在子带压缩技术中主要应用了心里声学种的声音掩蔽模型,因而在对信号进行压缩时引入了大量的量化噪声。然而,根据人类的听觉掩蔽曲线,在解码后,这些噪声被有用的声音掩蔽掉了,人的耳朵是无法察觉到的,同时由于子带分析的运用,各频带内的噪声将被限制在频带内,不会对其它频带的信号产生影响。因而在编码时个子带的量化阶数不同,采用了动态比特分配技术,这也正是此类技术压缩效率高的主要原因。在一定的码率条件下,此类技术可以马上达到“完全透明“的声音质量(EBU音质标准)。
子带压缩技术目前广泛应用于数字声音节目的存储 与制作和数字化广播中。典型的代表有著名的MPEG-1层Ⅰ、层Ⅱ(MUSICAM),以及用于Philips DDC种的PASC(Precision Adaptive Subband Coding,精确自适应子带编码)等。
(3)变换压缩技术与子带压缩技术的不同之处在于该技术对一段音频数据进行“线性”的变换,对所获得的变换域参数进行量化、传输,而不是吧信号分解为几个子频段。通常使用的变换有DFT、DCT(离散余弦变换)、MDCT等。根据信号的短时功率谱对变换域参数进行合理的动态比特分配可以使音频质量获得显著改善,而相应付出的代价则是计算复杂度的提高。
变换域压缩具有一些不完善之处,如块边界影响、预回响、低码率时声音质量严重下降等。然而随着技术的不断进步,这些缺陷正逐步的被消除,同时在许多新的压缩编码技术中也采用了传统变换编码的某些技术。
有代表性的变化压缩编码技术有Dolby AC-2、AT&T的ASPEC(Audio Sopectral Perceptual EntropyCoding)、PAC(Perceptual Audio Coder)等。
1.3 MPEG1 音频
MPEG-1音频作为数字存储媒体的运动图像和伴音的编码标准的一部分,由ISO/IEC 11172标准的第三部分(简称11172-3)规定。MPEG-1压缩标准是用来直接播放癞子CD-ROM(数据传输率约为1.5Mbit/s)或类似的光学存储设备和磁存储介质(包括磁带在内)的音视频格式的数据。
MPEG-1音频支持采样率为32,44.1,48KHz的单声道(mono)以及双声道(stero和Dual mono)等编码嘛事,并利用心理声学模型来控制音频信号的量化编码。MPEG-1共有三个不同层次的音频压缩算法:Layer1,Layer2和Layer3,它们对应不同的要求,具有不同的复杂度和不同的压缩效率。 MP3音乐文件解码程序设计(3):http://www.751com.cn/jisuanji/lunwen_9835.html