并非的所有的HMM都像图1-1那样复杂,模型越简单越便于估计和应用。一种最常见的模型是从左至右的模型,其一般形式示于图1-2。
此时,模型只有唯一的一个初始状态和一个终止状态,并且这个过程只要进入一个新的状态就不能返回到以前的状态。在图1-2所示的模型中,前向转移受到进一个步的约束:模型只能重复原有的状态,前进一个状态或两个状态。
为理解模型是如何工作的,下面具体研究一下其工作过程。假设产生某一时,图 1-2的模型依次经过1,2,2,3,4,4和5各状态。可以将该工程用图1-3(a)表示。
1-2由左至右的HMM。初始状态是1,终止状态是5
图1-3(a)产生一个假想单词的状态过程
(b)格形图,表示从状态1到状态5的各种可能的7状态路径,粗线相当于图(a)中的过程
图中表示的时间是从左向右进行的并假定每一状态都各有不同的输出。由于输出不是确知的,任何一个具体输出与任何一个具体状态之间不存在一一对应的关系。图1-3(a)中给出的输出是为了说明这一点。
实际上。我们并不知道是由哪一个过程得到的输出。为了把各种可能性都表示出来,重新表示图(a)的经历过程半将其画在所有可能过程的格形图中。模型经过7步由状态1转移到状态5,如图1-3(b)所示。格形图中的任何一条路径都是模型的可能路径,其中粗线表示的是图(a)所示的路径。
马尔可夫模型在每一个离散时刻,只能处于有限个状态中的某一个状态。当A,B阵已知后图1-2所示的模型可表示某个音节。由于A,B已确定且模型有确切的结构,因此它已表示为确定的数学模型。若难于使该字的音节数与其HMM状态数相同,则A,B子中各元素与物理量(音节)的对应意义会模糊不清。有些情况下为了计算量小和方法的统一,常将各个字音的模型的状态数设为相同,就会产生这种情况。这就是HMM一个缺点。
1.3 隐马尔可夫模型的定义
设有一个有限状态的过程,在每一个离散时刻n,它只能处于有限个多种状态下的某些一种状态。假设允许出现的状态有L种,记之为Sj,j=1~L。若该过程在时刻n所处的状态用
它的每一个分量
矩阵A是一个L×L文方阵,它的每一个元素用
即为已知相邻时刻中前一时刻的状态
A=[
可以看到,对于任意时刻n(n
如果
它表示在
假设一个HMM模型从n=1时刻开始运行,在n=1~N诸时刻所给出的N个随机失量
上述概率密度函数与n取何值无关,只取决于状态
B=[
其中,
注意,如果失量y的文数为1,则
HMM的过程是:
(1)根据初始状态分布概率
(2)根据B,得出
(3)根据A,由n时刻的
(4)如果n<N,则回到第(2)步,否则结束。
为此,可以用下式来说明这个过程。即隐马尔可夫模型可定义为
在A,B,
1.4隐马尔可夫模型三项问题的求解
HMM用于进行语音识别时,有三个基本问题必须解决:
(1)已知模型输出Y(即给定观察序列)及模型
(2)已知模型输出Y及模型
(3)如何根据模型的若干输出Y来不断修正模型参数,优化模型参数
这三类问题在语音识别中都要遇到。以孤立词识别为例,说有W个单词要识别,我们可预先得到这W个的标准样本,第一步是要为每单词建立一个模型,这就要用到问题(3)(给定观察下求模型参数)。为了理解模型状态的物理意义,可利用问题(2)将每一
上一页 [1] [2] [3] [4] [5] [6] [7] [8] [9] [10] ... 下一页 >>