毕业论文论文范文课程设计实践报告法律论文英语论文教学论文医学论文农学论文艺术论文行政论文管理论文计算机安全
您现在的位置: 毕业论文 >> 论文 >> 正文

语音信号隐马尔可夫模型仿真 第3页

更新时间:2008-4-21:  来源:毕业论文

语音信号隐马尔可夫模型仿真 第3页

并非的所有的HMM都像图1-1那样复杂,模型越简单越便于估计和应用。一种最常见的模型是从左至右的模型,其一般形式示于图1-2

此时,模型只有唯一的一个初始状态和一个终止状态,并且这个过程只要进入一个新的状态就不能返回到以前的状态。在图1-2所示的模型中,前向转移受到进一个步的约束:模型只能重复原有的状态,前进一个状态或两个状态。

为理解模型是如何工作的,下面具体研究一下其工作过程。假设产生某一时,图    1-2的模型依次经过1,2,2,3,4,45各状态。可以将该工程用图1-3(a)表示。 

 若图片无法显示请联系QQ752018766      

1-2由左至右的HMM。初始状态是1,终止状态是5

1-3a)产生一个假想单词的状态过程

(b)格形图,表示从状态1到状态5的各种可能的7状态路径,粗线相当于图(a)中的过程

图中表示的时间是从左向右进行的并假定每一状态都各有不同的输出。由于输出不是确知的,任何一个具体输出与任何一个具体状态之间不存在一一对应的关系。图1-3(a)中给出的输出是为了说明这一点。

实际上。我们并不知道是由哪一个过程得到的输出。为了把各种可能性都表示出来,重新表示图(a)的经历过程半将其画在所有可能过程的格形图中。模型经过7步由状态1转移到状态5,如图1-3(b)所示。格形图中的任何一条路径都是模型的可能路径,其中粗线表示的是图(a)所示的路径。

马尔可夫模型在每一个离散时刻,只能处于有限个状态中的某一个状态。当A,B阵已知后图1-2所示的模型可表示某个音节。由于A,B已确定且模型有确切的结构,因此它已表示为确定的数学模型。若难于使该字的音节数与其HMM状态数相同,则A,B子中各元素与物理量(音节)的对应意义会模糊不清。有些情况下为了计算量小和方法的统一,常将各个字音的模型的状态数设为相同,就会产生这种情况。这就是HMM一个缺点。

 

1.3 隐马尔可夫模型的定义

设有一个有限状态的过程,在每一个离散时刻n,它只能处于有限个多种状态下的某些一种状态。假设允许出现的状态有L种,记之为Sjj1~L。若该过程在时刻n所处的状态用 表示,那么 只能等于 中的某一个,这可表示为 { },对于任意的n,如果该过程运行的时间起点设定为n1,那么在以后每一时刻n它所处的状态以概率方式取决于于初始状态概率失量 和状态转移矩阵A。这里 是一个L文失量,即

                                  [ ]                                                                   (1-1)

它的每一个分量 初始状态为 的概率,即

                                          Pr [x1=Sj] (j1~L)                                             (1-2)

矩阵A是一个L×L文方阵,它的每一个元素用 表示,它是由状态 转移到状态 的概率,是状态转移的概率分布。这是一个条件概率,可表示如下: 

                                          [ / ]   (n 1) (ij1L )       (1-3)

即为已知相邻时刻中前一时刻的状态 的条件下后一时刻状态为 的概率。显然, 1,对于任意的 状态转移矩阵可表示为:

                                          A[ ]         若图片无法显示请联系QQ752018766                                                                         (1-4)

可以看到,对于任意时刻n(n 1),该过程的状态 中哪一种的概率只取决前一时刻(n-1)所处的状态,而与更前的任何时刻所处的状态无关。这样,由此产生的状态序列 , , 是一条一阶马尔可夫链。如果每个运行工程只完成N-1次状态转移,那么产生的是一条有限长度马尔可夫链 , , , ,这可用一个行失量表示为X[ , , , ]。对于任何一个特定X,其出现的概率 [X/ ,A]可用下式计算

                              [X/ ,A]                                   (1-5)

如果 具有离散分布,它的概率分布只取决于 ,可表示为

                                  [ ] [ / ](n 1)(j1~L)                 (1-6)

它表示在 状态下,输出 的概率分布。

假设一个HMM模型从n1时刻开始运行,在n=1~N诸时刻所给出的N个随机失量 构成一个广义N文行失量即矩阵Y[ , …… ]。对于HMM模型,其每一次运行过程所产生的马尔可夫链X是外界看不见的,可观测的只是Y

上述概率密度函数与n取何值无关,只取决于状态 L个概率密度函数构成一个L文行失量B,完可表示为

                                  B[ ]                                                                              (1-7)

其中, 即为 [ ]

注意,如果失量y的文数为1, 退化为一个实随机变量 。上面的HMM是时间离散和状态离散的HMM

HMM的过程是:

(1)根据初始状态分布概率 ,选择一个初始状态。置时刻n1.

(2)根据B,得出 状态下输出的概率分布

(3)根据A,由n时刻的 状态转移到nn1时为 状态的转移概率分布确定下一个状态,并置nn+1=2.

(4)如果n<N,则回到第(2)步,否则结束。

 为此,可以用下式来说明这个过程。即隐马尔可夫模型可定义为

                                  f(A,B, )                                                                     (1-8)

A,B, 这三个模型参数中, (初始概率分布)最不重要,B(某状态下系统输出的概率分布)最为重要,因为它就是外界观察到的系统输出的概率。而A(状态转移分布)的重要性要差一些。

 

1.4隐马尔可夫模型三项问题的求解

HMM用于进行语音识别时,有三个基本问题必须解决:

(1)已知模型输出Y(即给定观察序列)及模型 f(A,B, ),怎样计算产生Y的概率 [Y/ ]。若图片无法显示请联系QQ752018766    

(2)已知模型输出Y及模型 f(A,B, ),怎样估计模型产生此Y时最可能经历的状态X,即选择相应的最佳观察序列。这是一个识别问题,即对于给出的输出Y计算出所有模型输出它的概率,而输出概率最大者判定为对应于Y的模型。

(3)如何根据模型的若干输出Y来不断修正模型参数,优化模型参数 f(A,B, ),使最后得到的模型参数对模型输出的吻合概率最大,即使 [Y/ ]达到最大。这是一个学习(训练)问题,其中每一个Y称为一个学习样本。可以按照最大似然准则用这些学习样本求出 AB。也就是说,所求的这些模型参数将使HMM模型产生的各个样本的概率的平均值达到最大。

这三类问题在语音识别中都要遇到。以孤立词识别为例,说有W个单词要识别,我们可预先得到这W个的标准样本,第一步是要为每单词建立一个模型,这就要用到问题(3)(给定观察下求模型参数)。为了理解模型状态的物理意义,可利用问题(2)将每一

上一页  [1] [2] [3] [4] [5] [6] [7] [8] [9] [10]  ... 下一页  >> 

语音信号隐马尔可夫模型仿真 第3页下载如图片无法显示或论文不完整,请联系qq752018766
设为首页 | 联系站长 | 友情链接 | 网站地图 |

copyright©751com.cn 辣文论文网 严禁转载
如果本毕业论文网损害了您的利益或者侵犯了您的权利,请及时联系,我们一定会及时改正。