在医疗应用领域中利用语音特征提取技术对人类生理特征的参数进行提取, 与医学领域的很多学科相辅相成如生理学,解剖学等。安装假肢的患者他们的假 肢只响应患者的声音就是一个很好的列子。
在军事领域更是应用极广。利用语音特征参数提取技术为军事保密提供了很 大的选择空间不拘泥于指纹识别,密码输入等传统的保密方式。并且在人机互动 中起到了很大的作用。对于军用机器人的控制也将摆脱繁琐的手动遥控状态。变 得更方便、更快捷、更安全。
当然语音特征技术不仅在以上罗列的相关领域中得到应用。在其他如服务领 域、司法领域、金融领域等都有着广泛的应用前景。
1.3 论文的主要工作与安排
主要内容:本研究主要基于 LabVIEW 和 MATLAB 对语音信号进行采集与 处理,对语音信号中一些复杂的特征参数如 LPCC,MFCC(梅尔频率倒谱系数) 进行提取及研究。论文可可细化分为如下几方面:
(1)介绍语音特征提取的发展及应用还有本文的主要工作与安排。
(2)简单的概述一下设计所依赖的硬件部分的声卡以及软件的 LabVIEW 和
MATLAB。文献综述
(3)研究语音信号的相关知识便于语音特征参数的提取。如短时能量、短时 过零率等。
(4)研究语音信号预处理方式。如预加重主要是为了加窗分帧、端点检测等 方法的学习。
(5)研究实现复杂特征参数提取的算法。如 LPCC、MPCC 及小波变换等特征 参数的提取。
实施方案:根据实际需求,利用声卡进行语音的初步采集。连接 LabVIEW 将采集的信号进行时域以及频率域的分析。并将分析后的信号利用 MATLAB 进 行预加重、加窗等预处理的仿真,并对一些重要参数如 LPCC,MFCC 进行了仿 真。在本文中我采用一段“大学”的语音来进行论文研究的各种仿真。
2 语音信号理论与采集
2.1 语音信号概述
当需要研究分析一种语音信号处理技术时,必须对语音信号的理论知识有所 了解[1]。一般的,为了更方便的对语音信号进行数字化的处理,我们通常会采用 数字模型来简化研究过程。
2.1.1 语音信号的产生
语音信号的产生可以分为以下几个阶段:大脑得到需要表达的信息命令,通 过一些类的编码经过语音的发音器官进行发声,所发出的声波即我们要研究的语 音信号[2]。
2.1.2 语音的发音器官
发声器官,顾名思义就是用来产生语音的器官。主要由喉(larynx)、口腔
(oral cavity)、唇(lip)等组成,如图 2-1 所示。自下而上看起始于声门处而 终止于嘴唇。这样的一个发声系统也被称为声门系统,是产生语音能量的源泉。 而语音就是在声门系统中辐射出来的声波。
发音器官示意图
2.1.3 语音信号的基本组成
众所周知语音的基本组成单位是音素,“浊音”和“清音”则是音素的重要 分类,另外还有一种没有语音只有背景噪声的称为“无声”[3]。
如果按照其激励形式又可以分为“浊音”、“清音”、“爆破音”。
2.2 语音信号的采集与系统实现
提到语音信号的采集,必须要了解一下语音采集的相关基本知识。
2.2.1 语音信号的采集理论
语音信号作为种一维模拟信号,它的时间和幅度都在不停的变化之中。我 们必须要对语音信号进行采样和量化,提取出一组时间和幅度都要离散的数字信 号,这样我们才能将其放入 PC 机中进行处理来!自~751论-文|网www.751com.cn