基于DeepLearning的语音识别研究(4)

隐马尔科夫模型(Hidden Markov Model,HMM)这种模型是当今社会比较流行的一种，它是采用统计模式来进行识别的[4]。系统先是把首先把最初的语音信号提取来进行矢量化处理，然后变成对应的特征向量，可知其语音特征的序列号是

OT 

O ，O

O

时，再加上声学模型和语言模型的辅助，得到词序列文献综述

1 { 1 2 N }

W [23,24]，它的数学表示如下式 2-1：

~ T

式 2-1 中， P(W ) 是语言模型，代表给定序列W 的出现频率； P(OT | W ) 是声

学模型的序列是W 时， OT 是声学特征的输出频率； P(OT ) 是注意到声学的特征

1 1

OT 现实的概率，与词序列W 的选择没有关联，能被忽视不看。所以，式 2-1 变

成了：

式 2-2 的右半部分取对数，化简可得：

式 2-3 里的 P(OT | W ) 代表声学成绩，logP(W ) 代表语言成绩，各自通过对应

的算法计算而得到。因为一般都是声学特征库和文本语音库来训练声学模型以及语言模型的，所以式 2-3 里面用一个可以调控的参数来衡量一个词序列W 的有益程度。

2.2 语音特征提取来!自~751论-文|网www.751com.cn

与识别系统关联较大的就是声学特征，它是用来提取特征的信号参数的。只有找到合适的信号，才可以把信号应用到识别系统里面，像分类、回归等。从语

音识别上看，每个人都有自己独特的信号，这和个人的性别年龄都是密不可分的，当然，发音习惯也会有一定的影响，就会使虽然人们发出的声音内容一样，产生的语音波形也会产生不同的。最重要的就是怎样保证语音的纯粹性，怎样把声音杂质过滤掉，急需我们研究。

基于DeepLearning的语音识别研究(4):http://www.751com.cn/zidonghua/lunwen_78029.html