基于子带结构带宽可伸缩语音编码器的研究 第7页
类似的,对于一个连续信源,条件概率密度为
(3-12)
并且
对于有概率函数为Fp的信源(X,P)的率失真函数可以表示成
在香农引入了最初的率失真函数的概念后,率失真理论出现了许多有意义的成果。1959年,香农定义了速率失真函数R(D),并证明只要R(D)不超过信道容量就能使接收端的失真不超过给定的阈值D。对于幅值离散的信源,R(D)定义如式(3-14)所示。
R(D)= (3-14)
其中Q(Y)=
R(D)的逆函数为失真-速率函数D(R),它表示在给定速率不超过R的条件下,系统所能达到的最小失真。D(R)是在文数k趋向无穷大时Dk(R)的极限。
D(R)=
图3.1连续幅度无记忆高斯信源的率失真函数
然而,率失真理论仅仅局限于很少的一些应用,因为要找到一个合适的数学模型来表示真是的随机过程复杂性很大,用简单的信号来评测率失真函数也是有相当的困难。记忆信源相对于无记忆的信源在同一个失真测度D下具有较大的一个数据压缩空间。因为内在的统计依赖性可以被用来减少每个字节需要的最小信息量。记忆型的信源的R(D)的计算是很复杂的。仅仅对于高斯信源来说R(D)是可相对容易简单分析出来。
子带编码(SBC,Sunband Coding)[3]是一种在频率域中进行数据压缩的方法。在子带编码中,首先用一组带通滤波器将(BPF)输入信号分割成若干个子频带信号,然后将这些子带信号经过频率搬移转变成基带信号,再对它们在奈奎斯特速率上分别重新取样。取样后的信号经过量化编码,并合并成一个总的码流传送给接收端。在接收端,首先把码流分成与原来的各子带信号相对应的子带码流,然后解码、将频谱搬移至原来的位置,最后经带通滤波、相加,得到重建的信号。图3.2,3.3给出了子带编码、解码的工作原理图。
图3.2 编码器原理图
图3.3 解码器原理图
在子带编码中,若各个子带的带宽
把音频信号分割成相邻的子带分量之后,用2倍于子带带宽的采样频率对子带信号进行采样,就可以用它的样本值重构出原来的子带信号。例如,把4000Hz带宽分成4个等带宽子带时,子带带宽为1000Hz,采样频率可用2000Hz,它的总采样率仍然是8000Hz。
由于分割频带所用的滤波器不是理想的滤波器,经过分带、编码、译码后合成的输出音频信号会有混迭效应。据有关资料的分析,采用正交镜象滤波器QMF(quandrature mirror filter)来划分频带,混迭效应在最后合成时可以抵消。
图3.4表示用正交镜象滤波器分割频带的子带编译码简化框图。图中,用QMF把全带音频信号分割成两个等带宽子带。hH(n)和hL(n)分别表示高通滤波器和低通滤波器,它们组成一对正交镜象滤波器。这两个滤波器也叫做分析滤波器。
图3.4 两层子带编码器
把语音信号分成若干个子带进行编码主要有三个优点:
① 由于声音频谱的非平坦性,如果对不同的子带合理分配比特数,就有可能分别控制各子带的量化电平数以及相应的重建误差方差,使码率更精确地与各子带的信源统计特性匹配。
② 调整不同子带的比特赋值,就控制了总的重建频谱形壮。进一步语音心理和生理模型相结合,即可将噪声谱按人耳的主观噪声感知特性来成性。如果这种比特分配是自适应的,就能大大提高系统性能,因为此时对噪声的整形是动态实现的。
③各子带内的量化噪声都约束在本子带内,这样就能避免能量较小频带内的输入信号被其它频段的量化噪声所遮盖。
带宽可伸缩编码就是通过增加频率带来得到更好的语音质量。假设语音信号的
上一页 [1] [2] [3] [4] [5] [6] [7] [8] [9] [10] ... 下一页 >>