2.2.1 数字化
在实际应用过程中,语音信号的数字化涉及到多种对语音信号的处理,如对信号的放大、增益控制、反混叠滤波、采样、A/D变换及编码等;
本实验中我们需对语音信号进行反混叠滤波,来滤除输入信号频域分量中频率大于采样率二分之一的分量,来防混叠的同时也可滤除电源的工频干扰。此过程中的反混叠滤波应满足带通滤波器的特性,对语音信号来说此滤波器的上下截频可取为, =3.4KHz、 =60 100Hz,采样频率 =8kHz。对语音信号的数字化可得到二进制数字码这过程包括对信号的滤波、A/D变换等。对信号的A/D变换中必须对信号进行量化,量化过程中会产生量化噪声。目前主要的A/D变换器可分为线性和非线性,其中使用最多的是线性A/D变换器,它们两者的区别在于每个采样脉冲位数的差异,线性A/D变化器是12位,而非线性A/D变换器则是8位的。
2.2.2 预处理
预处理一般包括预加重、加窗和分帧等。
声门激励和口鼻辐射会影响到语音信号的平均功率谱。对语音信号频谱分析可知,语音信号在频率大于800Hz时其频谱幅度会发生频谱衰落。因此求取语音信号频谱时,由高频畸变导致,高频部分频谱比低频部分的求取更加复杂。为改善信号的高频特性我们可以在预处理中对信号进行加重,这样的好处是我们在对信号的频谱分析时所采用的是相同的信噪比,这样也利于语音信号特征参数的分析。语音信号数字化是在反混叠滤波器之前对语音信号进行加重,在压缩信号的动态范围的同时,也优化了信号的信噪比。语音信号的预加重是将语音信号通过一个加重滤波器,该滤波器可提升信号的高频特性。而一般这样的滤波器通过一个一阶数字滤波器就可实现,该滤波器的系统传递函数可以表示为:(2-1) 式中 值接近于1。
2.2.3 窗函数的选择
语音信号实现数字信号的转变并进行预加重等滤波处理后,加窗分帧等。对语音信号的分帧中一般要求每秒的帧数在33到100帧间。语音信号的分帧方过程中一般采用交叠分段的方法。交叠分段方法形成的每帧间可实现平滑过渡,且具有较好的连续性,对原信号信息的保留较为完整。该方法会出现相邻帧间的混叠,混叠部分称为帧移。帧移的长度一帮会因为帧长的改变而发生变化,但一般帧移的长度小于帧长的一半。对语音信号的分帧其实质是用可移动的有限长度窗口对语音信号进行加权,类似于对语音信号的采样,不过这样的窗的长度更长。语音信号经过加窗后可表示为:式中s(n)为经过处理的语音信号,w(n)为窗函数。
Matlab语音识别特征参数LPCC和MFCC研究+程序(4):http://www.751com.cn/tongxin/lunwen_70210.html