汉语是单音节结构的带调语言,共有4种声调,即阴平、阳平、上声和去声。声调在汉语词义辨别当中担当了重要的角色,例如,“妈/ma1”,“麻/ma2”,“马/ma3”,“骂/ma4”,如果声调变了,那么整个词义就会发生重大的变化。汉语有1300多个带调音节,如果去掉声调,汉语中音节有400多个。通过对汉语字典的研究,如果去掉声调,汉语中大约有30%是同音词,因此如果能够准确地获取声调信息,将会大大提高汉语语音识别的性能,此外,汉语声调也能够表达人的情感,通过音调可以使机器更进一步地理解人类语言的含义,所以汉语基频的提取及识别成为汉语语音识别研究中重要的内容。源]自{751^*论\文}网·www.751com.cn/
1.2 语音识别国内外现状及分析
1.3 声调识别处理工具
MATLAB是由美国mathworks公司发布的主要面对科学计算、可视化以及交互式程序设计的高科技计算环境。它将数值分析、矩阵计算、科学数据可视化以及非线性动态系统的建模和仿真等诸多强大功能集成在一个易于使用的视窗环境中,为科学研究、工程设计以及必须进行有效数值计算的众多科学领域提供了一种全面的解决方案,并在很大程度上摆脱了传统非交互式程序设计语言(如C、Fortran)的编辑模式,代表了当今国际科学计算软件的先进水平。
MATLAB和Mathematica、Maple、MathCAD并称为四大数学软件。它在数学类科技应用软件中在数值计算方面首屈一指。MATLAB可以进行矩阵运算、绘制函数、实现算法、创建用户界面、和数据、连接其他编程语言的程序等,主要应用于
matlab开发工作界面
工程计算、信号处理与通讯、控制设计、图像处理、金融建模设计与分析等领域。
MATLAB软件为工程计算领域提供了准确、高效的多种功能的工具箱,在信号和图像处理等领域具有无可比拟的优势,具有良好的人机交互界面、计算机图形化显示以及强大的数据处理分析能力。EMD是近年来应用前景比较好的信号处理方法之一。通过MATLAB和EMD的结合,实现良好的人机交互界面、计算机图形化显示以及强大的数据处理分析能力的结合。
1.4 本文研究的内容和结构
本课题拟提出一种基于经验模式分解(EMD)的汉语普通话声调识别算法。该算法对汉语普通话倒谱后进行EMD变换,有效地的将包含周期性声门波的本征模式函数(IMF)分离开,进而进行汉语语音基频检测。获取基频后通过研究基频波形的斜率从而可以识别出语音的具体声调。
本课题首先要求广泛调研一些传统的汉语普通话声调识别算法,同时了解EMD算法的原理及特性,接着在matlab环境下实现基于EMD的汉语普通话声调识别算法,最后通过语音实例来验证新算法的准确性与可靠性,并与传统方法进行对比。
本文的结构:第二章介绍汉语普通话基频提取的理论依据,第三章介绍如何使用倒谱法和经验模式分解方法提取基频,第四章介绍用Matlab实现的具体流程。第五章验证本课题程序的正确性。