隐马尔科夫模型(Hidden Markov Model,HMM)这种模型是当今社会比较流行 的一种,它是采用统计模式来进行识别的[4]。系统先是把首先把最初的语音信号 提取来进行矢量化处理,然后变成对应的特征向量,可知其语音特征的序列号是
OT
O ,O
O
时, 再加上声学模型和语言模型的辅助,得到词序列文献综述
1 { 1 2 N }
~
W [23,24],它的数学表示如下式 2-1:
~ T
式 2-1 中, P(W ) 是语言模型,代表给定序列W 的出现频率; P(OT | W ) 是声
学模型的序列是W 时, OT 是声学特征的输出频率; P(OT ) 是注意到声学的特征
1 1
OT 现实的概率,与词序列W 的选择没有关联,能被忽视不看。所以,式 2-1 变
成了:
式 2-2 的右半部分取对数,化简可得:
式 2-3 里的 P(OT | W ) 代表声学成绩,logP(W ) 代表语言成绩,各自通过对应
的算法计算而得到。因为一般都是声学特征库和文本语音库来训练声学模型以及 语言模型的,所以式 2-3 里面用一个可以调控的参数来衡量一个词序列W 的有 益程度。
2.2 语音特征提取来!自~751论-文|网www.751com.cn
与识别系统关联较大的就是声学特征,它是用来提取特征的信号参数的。只 有找到合适的信号,才可以把信号应用到识别系统里面,像分类、回归等。从语
音识别上看,每个人都有自己独特的信号,这和个人的性别年龄都是密不可分的, 当然,发音习惯也会有一定的影响,就会使虽然人们发出的声音内容一样,产生 的语音波形也会产生不同的。最重要的就是怎样保证语音的纯粹性,怎样把声音 杂质过滤掉,急需我们研究。
基于DeepLearning的语音识别研究(4):http://www.751com.cn/zidonghua/lunwen_78029.html