个单词的训练序列分割为一些状态,再研究导致与每一状态相应的观察结果的那些特征。最后识别未知单词就要利用问题(1),即对给定观察结果找出一个最合适的模型(此处对应一个单词),以使
下面,分别讨论这两个问题。
可分为是四个步骤:
(1)首先在n=1,2,
这里,
(2)计算HMM模型
(3)状态X和输出Y同时出现的联合概率,是上面两个概率的乘积
(4)由此。产生任意一个Y的概率,就是上式对所有可能出现的X求和
式(1-12)的运算量相当大,大约为
HMM的识别是指在给定输出Y的条件下,在一组HMM中作出判决,判定出哪一个输出Y的最大可能性。
一种可能的最佳准则是,选择状态
它是在给定输出Y和模型
这里,存在一个问题:有时会出现不允许转移的情况,即
1.5HMM的一些实际问题
本节讨论HMM应用中的几个问题。
最主要的分类是状态的转移是吸收的,还是不吸收的。在图1.1所示的HMM中,允许模型从任一状态向所有状态过渡,由此状态转移概率矩阵A中的每一个元素都可能为非零。他的起始和终止状态也是可以任选的,这种类型称为不吸收型。
但是对语音信号来说,最感兴趣的还是吸收型的,因为这比较符合语音的实际情况。图1-2所示即为吸收型的HMM。在该模型中限定状态1为起始状态,每个只能向下标等于或大于当前下标的那种状态,而且下标小的状态将优先于下标大的状态。这种状态称为“左—>右”吸收型转移模型。图1-2是一个五状态的“左—>右”吸收型的例子。
这种模型的矩阵A是一个上三角矩阵,而相当于终止状态的最后一行除了一个元素外全为零,因而再也不能从终止状态转移出去。因为A比较稀疏,所以大大减少了模型参数估值的计算量;由于初始状态只有一个,所以
B参数[3]描述在某状态时模型输出的概率分布。前面的分析中假定它是离散的,现将其推广到连续的情况。此时不能用矩阵表示,而应改用概率密度了表示。即将
这种概率密度的形式为
式中,
由此,在建立此类模型时,需设计下列参数:(1)L:模型状态数;(2)M:基正态函数个数;(3)矩阵A;(4)
除了“高斯M元混合密度外”,概率密度的形式还有“高斯自回归M元混合密度”,“椭球对称”的概率密度和“对数凹对称和/或椭球对称”的概率密度等。由于它们的概率分布是连续的,所以比离散的情况能更好的描述信号的时变特性。
上一页 [1] [2] [3] [4] [5] [6] [7] [8] [9] [10] ... 下一页 >>