选择最普遍的极零模式来描述声道相应 ,其z变换的形式为:
(2.3)
经过傅立叶变换,取对数和逆傅立叶变换后可以得到其复倒谱:
对于倒谱可以只考虑它的幅度特性,可以看出,它是一个衰减序列,且衰减的速度比1/|n|快。因而它比原信号x(n)更集中于原点附近,或者说它更具有短
时性。倒谱法根据对数功率谱的逆傅立叶变换,能够分离频谱包络和细微结构,很精确地得到基音频率和共振峰信息,但它的运算量比较大。当采用无噪语音时,用倒谱进行基音提取的效果是很理想的。然而当存在加性噪声时,在对数功率谱的低电平部分会被噪声填满,从而掩盖了基音谐波的周期性。这意着倒谱的输入不再是纯净的周期性成分,而倒谱中的基音峰值将会展宽,并受到噪声的污染从而使倒谱检测方法的灵敏度也随之下降。在基音估计中还可以使用经过中心削波或三电平削波后的自相关方法,这种方法在信噪比低的情况下可以获得良好的性能。
2.1.2 基于线性预测(LPC)的共振峰求取方法
基于线性预测(LPC)的共振峰求取方法:一种有效的频谱包络估计方法是从线性预测分析角度推导出声道滤波器,根据这个声道滤波器找出共振峰。虽然线
性预测法也有一定的缺点,例如其频率灵敏度与人耳不相匹配,但对于许多应用
来说,它仍然是一种行之有效的方法。线性预测共振峰通常有两种途径可供选择:一种途径是利用一种标准的寻找复根的程序计算预测误差滤波器的根,称为求根法;另一种途径是找出由预测器导出的频谱包络中的局部极大值,称为选峰法。
线性预测(LPC):是传统方法中最有效的一种共振峰参数估计方法。在语音序列s(n)中任取一个时刻n,假设n以前的p个样值s(n−1)、s(n−2)...s(n−p)已知,则可由它们的线性组合预测当前时刻的样值s(n),
信号真实值与预测值之间的误差称为线性误差,用 e(n)表示,即,
线性预测的基本问题是通过语音信号直接计算出一组预测器系数 ,使得e(n)在某个准则下达到最小,一般选取最小均方误差。e(n)是一个随机序列,可用其均方值 来衡量线性预测的质量。显然, 越接近于零,预
测的准确度在均方意义上越佳。线性预测的过程本质上来说就是找到一组预测系数使得 最小。由于语音信号的时变特性,预测器的估值必须在一段短时间语音信号中进行。在最小二乘意义下,令 并对系数 求导使之为零。这样,我们就可以得到线性预测的标准方程,
(2.7)
令 r(j)=E(s(n)s(n−j))是s(n)的自相关序列,上式即简化为,
(2.8)
可进一步改写成如下矩阵形式(Yule-Walker方程),
r−RA=0 (2.9)
其中,r、R和 A分别代表自相关矢量、自相关矩阵和预测系数矢量。p个预测器系数 可通过求解Yule-Walker方程得到。
对于语音信号中的浊音段,用线性预测分析估计共振峰有两种方法,最直接的方法是对语音的全极点模型 的分母(一个具有p+1项的多项式)进行因式分解,找到这个多项式的复根,即得到了共振峰的性质和频率补偿因式。 基于经验模式分解的汉语共振峰检测算法(3):http://www.751com.cn/tongxin/lunwen_2168.html