基于子带结构带宽可伸缩语音编码器的研究 第8页
信源带宽为
(3-17)
其中
图 3.5 通用带宽可伸缩示意图若图片无法显示请联系QQ752018766
我们以两层结构带宽可伸缩编码器来说明实现原理。核心层傅立叶带宽是信源带宽的一半。增强层傅立叶带宽是整个信源带宽或整个信源带宽的一半,并且依赖系统结构。全带结构的带宽可伸缩问题如图3.6所示。
图 3.6 全带结构的带宽可伸缩问题
我们假设信源X具有功率谱密度
基于MSE核心层编码器的率失真函数如公式(3-18)、(3-19)所示。
(3-19)
其中,
全带结构的编码器的率失真函数如公式(3-21)、(3-22)所示[15] 。
其中,
如果
图3.7 全带结构编码器的失真曲线
图3.8 核心层编码器的失真曲线
所以,带宽可伸缩性可以通过两层编码器之间选择得到。两层带宽压缩因子分别是
在3.5节对子带编码的基本原理已进行概述。子带压缩技术就是利用带通滤波器和子采样技术获得在时频域的压缩。在文献[10]中,有许多理论应用于子带编码。本节主要总结现有子带编码工作基础上,以两个子带编码系统来讨论子带结构的带宽可伸缩编码理论。
全带结构系统的p阶线性预测的谱粗糙测试如公式(3-23)所示[16]。其中,
同样,对于具有p阶线性预测的子带结构编码系统的谱粗糙测试如公式(3-24)所示[16]。
所以,由于子带处理过程所减少的记忆量如公式(3-25)所示。
对于PCM编码的信号,
其中,
所以,子带编码提供一个增益通过有限阶预测的全带结构编码和每子编码。在无限阶的预测全带结构编码中,和经过优化后的子带编码中,不产生增益。对于白噪声也不产生增益。
子带编码所产生的增益和实际采用的率失真函数相关。对于一个PCM的编码全带信号的方案中,采用基于MSE的编码的率失真如公式(3-27)所示[17]。
其中,
选择每一个子带的编码速率
其中约束条件是
使用标准Lagrangian技术,可以计算优化后每子带的编码速率。在较小的率失真的情况下,最小率失真由公式(3-30)给出。
子带编码增益可以由和所定义,具体如公式(3-31)所示。
其中,信源是白噪声时,等号成立。若图片无法显示请联系QQ752018766
本章主要介绍了可伸缩编码的相关理论,包括了: 可伸缩编码的基本原理、语音压缩的理论依据、可伸缩编码的理论基础率失真理论和可伸缩编码的实现方案。可伸缩编码理论是重要部分,是编码器的设计的基础。
在下一章中,将主要针对子带滤波器组设计与优化进行介绍分析。
子带滤波器组的设计是子带编码的关键。如果按理想带通的Nyquist采样率对子带信号采样则会产生混叠,为了减少混叠造成的失真,滤波器的滚降特性必须陡峭,这就要求阶数较高的滤波器。在数字实现中,为了实现线性相位滤波,往往需要采用128-256阶,甚至更高阶的FIR滤波器,才能使得混叠效应不至于对子带编码质量产生明显的影响,这使得子带滤波器组的运算负担太大,产生较大延时。正交镜像滤波器组QMFB(Quadrature Mirror Filter Banks)能够较好的解决混叠失真的问题,对滤波器的滚降特性可以极大的降低要求,一般只要使用16-32阶就足够,从而简化了子带编码系统的实时实现。
本文中主要介绍2通道QMF组的原理和优化方法。2通道QMF的原理图4.1如下所示, 其中H0和H1组成分析滤波器组(H0,H1频率特性如图2-2),G0和G1组成综合滤波器组: 若图片无法显示请联系QQ752018766
图4.1 2通道QMF组原理图
图中分别表二整带的低通和高通分解滤波,分别表示低通和高通综合滤波器。如果
上一页 [1] [2] [3] [4] [5] [6] [7] [8] [9] [10] ... 下一页 >>