(2)从语音信号中去除声道的影响,直接取出仅与声带振动有关的声源信息并非易事。而声道共振峰可能强烈改变声门波形的结构,从而严重影响激励信号的谐波结构,会给基音检测造成困难。
(3)语音信号是准周期的,且共振峰结构和噪声有时会影响波峰和过零率,很难准确定位基音周期的开始和结束。
(4)区分清音语音和低电平浊音段是导致基音检测困难的另一个重要因素。在许多情况下,清音语音与低电平浊音段之间的过度段是非常细微的,确认它是极其困难的。
(5)在实际应用中,背景噪声强烈影响基音检测的性能。
(6)基音周期变化范围较大,从低音男声的80Hz直到女孩的500Hz,这也给基音周期的检测带来了一定的困难。另外,浊音信号可能包含有三四十次谐波分量,而基波分量往往不是最强的分量。因为语音的第一共振峰通常在 Hz范围内,这就是说, 次谐波成分往往比基波分量还强。丰富的谐波成分使语音信号的波形变的很复杂,给基音检测带来困难,经常发生基频估计结果为实际基音频率的二三次倍频或二次分频的情况。
2.2 基音周期提取方法
目前基音的提取方法大致可以分为三类:
(1)波形估计法。直接由语音波形来估计基音周期,分析出波形上的周期峰值。包括并行处理法,数据减少法等。
(2)相关处理法。这种方法在语音信号处理中广泛使用,这是因为相关处理法抗波形的相位失真能力强,另外它在硬件处理上结构简单。包括波形自相关法,平均幅度差分函数法(AMDF),简化逆滤波法(SIFT)等。
(3)变换法。将语音信号变换到频域或倒谱域来估计基音周期,利用同态分析方法将声道的影响消除,得到属于激励部分的信息,进一步求取基音周期,比如倒谱法。虽然倒谱分析算法比较复杂,但基音估计效果较好。
2.3 倒谱和复倒谱
语音信号不是加性信号,而是卷积信号。为了能用线性系统对其进行处理,可以先采用卷积同态系统处理。经过卷积同态系统后输出的伪时序序列称为原序列的“复倒频谱”。它的定义式可以表示为:
(2-1)
倒谱或称“倒频谱”的定义为: (2-2)
它和复倒谱的主要区别是对序列对数幅度谱的傅立叶逆变换,它是复倒谱中的偶对称分量。它们都将卷积运算,变为伪时域中的加法运算,使得信号可以运用满足叠加性的线性系统进行处理。复倒谱涉及复对数运算,而倒谱只进行实数的对数运算,较复倒谱的运算量大大减少。
如果 和 分别是 和 的倒谱,x(n)= * ,那么x(n)的倒谱c(n)= + 。
如果已知一个实序列x(n)的复倒谱 ,那么可以由 求出它的倒谱c(n)。为此首先将 表示为一个偶对此序列 和一个奇对称序列 之和: = + 其中 = , =
易于证明
由于一个偶对称序列的DTFT是一个实函数,而一个奇对称序列的DTFT是一个虚函数,可得
这样,由 即可求得c(n)。如果设(2-8)
那么可以同理导出:(2-9)
称为“相位倒谱”,不难看出,c(n)表现的是x(n)的DTFT 的模函数的特征, 表现的是 相位函数的特征,而 包括两个方面的特征。 Matlab基于倒谱和EMD的语音基音周期的提取(3):http://www.751com.cn/tongxin/lunwen_7088.html