由于ANN具有高度的并行性,所以它可以进行快速判决并兼有容错能力,某些节点的损伤不会影响判决结果,这个优势在识别判决方面表现突出。它采用竞争型网络,在训练阶段采用采用监督学习方法,即可以根据训练样本不断地修正权值,但是在测试阶段采用无监督学习方法,在测试的同时进行学习,是测试网络能够适应测试对象的变化,即可以不断的实时更新参考模板,这个特点恰好迎合说话人识别系统设计的要求,就是参考模板可以随着说话人状况的变化而变化。ANN还具有存储记忆的功能,它可以用先验知识对网络进行部分训练,使系统存储记忆一些错误信息,当测试阶段出现完全相同的错误时,网络会把它纠正到正确的分类里面。
1.4 选用MATLAB的原因
MATLAB是矩阵实验室(Matrix Laboratory)之意。MATLAB语言是一种应用于很多电子通信与数值分析领域的高级语言,经过了将近三十年的发展与激烈竞争,MATLAB已经成为国际公认的最优秀的工程应用开发软件,虽然它每年都在不断的更新,实现新的功能,但是新版本都是可以完全兼容老版本的,如此方便的语言在信号与系统中,通信原理中,数字信号处理中等专业性强的领域中都得到了广泛的应用。
MATLAB的特点:
(1)具备强大的数值和符号计算功能,可解决大计算量的符号计算和推导。
(2)具有强大的编程语言,MATLAB除了可进行命令行的交互式操作之外,还可以进行程序方式操作,比如可以直接实现C或FORTRAN的几乎所有功能,以及设计WINDIOWS图形用户界面。
(3)具有很好的图形功能,可以很容易的实现二至四文图形的绘制,还可以利用图形用户界面GUI制作用户菜单和控件。
(4)可以直接的处理多种格式的声音文件,比如wav,和图像文件如bmp、gif、pcx、tif、jpeg等。
(5)具有强大的工具箱,分为功能性工具箱和学科性工具箱两大类。
(6)具有很好的扩展功能,用MATLAB语言编写的程序不需要进行编译就可以直接运行。用户还可以将MATLAB语言编写的m文件转换为独立的可执行的exe格式的文件。
(7)具有强大的SIMULINK仿真工具,SIMULINK为多种不同的专业,提供了丰富的专业型模块。除此之外,用户还可以自己建立模块或者模块库[8]。
2. 语音识别系统
本设计以MATLAB软件为平台,主要实现的功能有录制语音、播放语音、预处理、特征提取和最后的识别语音。
语音识别系统的流程图如图1所示。
图1 语音识别系统的流程图
从本质上讲,语音识别就是语音信号模式识别,它由训练和识别两个过程完成。语音信号是一种典型的非平稳信号,并且在录音过程中不可避免的受到电噪音,呼吸产生的气流噪音等诸多噪音的影响,因此要经过预滤波、采样量化、分帧、加窗、预加重、端点检测等预处理过程后才可以进行特征参数提取等工作[9]。
在语音训练阶段,将那些状态良好的信号,即携带噪声小且特征参数稳定的语音作为指定词条的模板。识别阶段中是将语音信号经过相同的通道生成测试模板,计算得出测试模板的特征参数后,将其与模板库模板的特征参数用DTW(动态时间规整)的方法进行匹配,匹配差距最小的参考模板作为识别结果。
2.1 语音采集
其中,语音采集由WINDOWS自带录音系统完成,选择在比较安静的环境中采集特定人的语音,保存形成的WAV格式文件,经过一系列处理作为参考模板,而且待测语音也要通过相同的处理形成待测模板,语音采集流程图如图2所示。
图2 语音采集流程图
通过计算机自带的麦克风,经过滤波,采样,模数转换等操作形成了WAV文件,作为本设计处理的对象。 MATLAB语音识别系统的设计+DTW算法+流程图(4):http://www.751com.cn/tongxin/lunwen_809.html