线性预测分析的基本原理是语音信号的每个取样值能够用过去若干个取样值的线性组合(预测值)来逼近[3][4]。当实际语音样本值和线性预测样本值之间差值的平方和达到最小值(即按照最小均方误差法进行逼近)时,就能够唯一地确定一组预测参数,即线性组合中所用的加权系数。
线性预测分析采用线性预测误差滤波器来实现,线性预测误差滤波器的传递函数为:
A(z)=1-
其中p为预测系数,
线性预测误差滤波如图2.5所示:若图片无法显示请联系QQ752018766
图2.5 线性预测误差滤波
e(n)=s(n)-
其中,
对于一个特定的语音序列,
S(n)=
则
其中:f(n)=
这样,可以得到
考虑e(n)是白噪声的情况,这时序列e(n)的各个样点值相互统计独立。由此不难导出f(n)和g(n)相互统计独立,因此
+
式(2-9)右侧有p个变量:a1~ap,令
导出:2{
可以将这p个方程写成如公式(2-11)形式:
这称为一组LPC正则方程,其中
矢量量化编码是近年来图像语音信号编码技术中流行的一种新型量化编码方法。它按照每组K个数据对处理数据序列分组,这样每组数据构成一个K文矢量,然后以K文矢量为单位进行量化,因此称为矢量量化。它与标量量化每次仅处理一个采样数据有着很大的区别。
矢量量化[4][5](Vector Quantization, VQ)是20世纪70年代后期发展起来的一种数据压缩技术,也可以说是仙农信息论在信源编码理论方面的新发展。矢量量化是将若干个幅度连续取值的时域采样信号分成组,构成矢量,然后用若干个离散的数字值来表示各种矢量。矢量量化之所以能压缩数据,是由于它能去掉冗余度,且能有效地利用矢量各分量间的四种相关的性质:线性依赖性,非线性依赖性,概率密度函数的形状及矢量文数。
矢量量化[3]是一种限失真编码,其原理仍可用信息论中的率失真函数理论来分析。而率失真理论指出,即使对无记忆信源,矢量量化编码也总是优于标量量化。利用矢量量化,编码性能可任意接近速率-失真函数,其方法是增加矢量的文数k。在实际应用中,速率-失真函数常常作为一个理论下限与实际编码速率相比较,分析系统还有多大的改进余地。
矢量量化的基本过程是将语音信号波形的k个样点的每一帧或有k个参数的每个参数帧构成文欧氏空间的一个矢量,然后对此矢量“集体”量化。
量化的基本原理是将k文无限空间划分为M个区域边界,然后将输入信号的矢量与这些边界进行比较,并被量化为“距离”最小的区域边界的中心矢量值。而量化过程中产生的主要问题是:
(1)如何划分M个区域边界:需要用大量的输入信号矢量,经过统计实验才能确定,此过程称为训练或是建立码本。方法是将大量的信号波形帧矢量或参数帧矢量进行统计划分,进一步确定这些边界对应的中心矢量值得到的码本。
(2)如何确定两矢量比较时的测度:此测度是两矢量间的距离,或以其中的某个矢量为基准的失真度。失真测度是指输入矢量用码本所对应的矢量表征时所付出的代价。
语音信号矢量量化的原理如图2.6所示。每输入一个含有N个样本的语音帧(或含有N个参数的参数帧)构成的N文输入矢量X,就输出一个与之对应的K文Yjmin是X的重构矢量。K可以等于N,也可以不等于N,最简单的情况是K=N。当Yjmin是对一帧语音进行各种变换或分析后得到的矢量,这K往往远远小于N。
图2.6 矢量量化原理框图若图片无法显示请联系QQ752018766
语音编码主要有三大类,分别为波形编码、参数编码和混合编码。波形编码直接对语音信号的波形进行编码,一般码率较高,语音重构质量佳,但它随着码率的降低语音质量将严重下降。
波形编码方式的最简单形式是均匀脉冲编码调制(Pulse code modulation ),简称PCM)。 它是用同等的量化级数进行量化的,即采用均匀量化这种方式将语音变换成与其幅度成正比的二进制序列,而二进制数值往往用脉冲表示并用脉冲对采样幅度进行编码,故称为脉冲编码调制。这种方式完全没有利用语音的性质所以信号没有得到压缩。这种编码方式的特点是适应能力强、重建语音的质量高,例如PCM、
上一页 [1] [2] [3] [4] [5] [6] [7] [8] [9] [10] ... 下一页 >>