2.3.2 短时过零率分析 8
2.4 语音信号的频域分析 8
2.4.1 短时傅立叶变换 8
2.4.2 语谱图 9
2.4.3 复倒谱和倒谱 9
2.4.4 基因周期估计 10
第三章 语音信号的特征参数 10
3.1 线性预测倒谱参数LPCC 11
3.2 美尔倒谱参数 MFCC 14
第四章 MATLAB对语音信号的仿真处理 17
4.1 语音信号的数字化、预处理 17
4.1.1 数字化 17
4.1.2 预处理 19
4.2 语音信号时域分析 22
4.2.1 信号短时平均能量 22
4.2.2 短时过零率分析 22
4.3 特征参数提取 23
4.3.1 Matlab对语音信号仿真提取LPCC特征参数 24
4.3.2 Matlab对语音信号仿真提取MFCC特征参数 25
结论 27
致 谢 28
参考文献 29
附录A 31
附录B 33
第一章 绪 论
1.1 语音信号处理技术简介
语音是人类信息交流的载体。从语音的发声原理讲,即是由人的声道控制气体的流动,带动空气分子的振动,形成语音波形。语言交流的过程即是人与人之间信息传递的过程,但随着人类的发展,实现远距离通信成为人们迫切的需求。除了以文字为载体的信息传递,人们更加渴望信息传递的高效与实时性。现代通信中的手机通信即是人们对语音信号传输、分析处理以及电子技术等发展的产物。语音信号承载了大量的语音信息,物理角度上还具有声波物理特性。声波特性的语音信号到电信号的转换大大的方便了语音信号的分析、处理以及传输。
在对语音学的研究的同时,语音信号处理构成了数字信号处理的主要内容。在语音信号处理的发展过程中逐步形成了以语音编码、语音合成、语音识别为代表的主要技术。
通信技术发展主要方向是信号的数字化传输。通信技术的发展主要经历了模拟通信、数字通信等,语音的数字通信提高了传输效率的同时也大幅度提高了传输质量。同时语音编码技术的发展为语音的数字化通信的安全性提供了保障,各种编码方式的不同为信号的加密传输提供了方便。除了现代通信中,语音信号的数字化也使网络资源利用率更高效。要实现对语音信号的数字化最简单的方式是对语音信号进行模数转换,根据采样定理选择合适的采样率与量化标准即可。虽然过程十分简单,但这样得到的语音信号数据量大,不利于传输和存储。这时我们可以对其进行压缩处理,来减少数据量,这就是语音的编码技术要实现的功能。语音编码的目地是用最少的数据量来实现语音信号的存储或者传输,同时还需保证语音信号的可恢复性以及一定的语音质量要求。
1939年Dudley发明的声码器标志着语音编码技术研究的开始,30多年后,仅有PCM与ADPCM技术取得较大发展,当这些技术主要用于高比特率的语音处理技术。70年代初,基于计算机网络上的语音通信研究逐步开始。当时的实验平台还是基于Arpanet网络(它是美国国防部高级研究计划署开发的世界上第一个运营的封包交换网络,是全球互联网的始祖 )。第一次分组语音实验由加州大学和林肯实验室合作完成。后来进行的分组语音通信实验中用到了LPC声编码器。同时也在分组电话会议中得到运用。进入80年代,局域网的语音通信成为主要方向。后来出现了多种编码标准,如美国政府在1980年公开的LPC编码标准,这建立了数字电话在普通带宽信道中传输的基础。后来的出现的CELP语音编码标准,RELP编码标准,语音信号采用这些编码标准的后音质都很高,且被人们所接受。20世纪80年代,因特网技术的的兴起以及语音编码技术的发展,大量的语音通信技术被提出并被实际应用。例如当时首相应用于网络游戏的IP分组语音通信,该技术实现了软件包的传输并用来存储语音信息。90年代,局域网语音通信相关的网关产品开始出现,这些产品在实现网内语音通信的同时也可和外网实现电话通信。伴随这些产品出现的还有大量的与产品相关的协议或者规范。同时大量的语音编码国际标准纷纷出现,他们各自都基于不同的数码率。除了这些编码标准外,也存在许多数码率低,算法成熟的编码方式,其中某些编码率甚至低于1.2Kbps,且仍能够提供可识别的语音。论文网