您现在的位置：毕业论文 >> 论文 >> 正文

语音信号隐马尔可夫模型仿真第6页

更新时间：2008-4-21: 来源：毕业论文

语音信号隐马尔可夫模型仿真第6页

3.1 语音识别中的HMM

在语音识别中，所谓的观察序列就是通过计算得到的一帧帧的语音参数，如MFCC参数。而状态则是在训练阶段事先预定好的不同语音单元。对于汉语普通话来说，语音单元可以是一个完整的音节，也可以是声母或韵母，还可以是更为精细的夜音素。若图片无法显示请联系QQ752018766

3-1HMM与影印参数的关系

一个HMM模型由若干个状态组成。随着时间的变化，各个状态之间可以发生转移，也可以在一个状态内驻留。每个观察向量对不同的状态都都有相应的输出概率。如图3-1所示的HMM，包含有四个状态～，状态之间或状态自身的转移概率用表示，输入观察序列为 ,，每个观察序列是一帧MFCC参数。在这个模型中序列 , 是可观测的输入序列，称为序列，而每一时刻所处的状态却是隐含的。

3.2　HMM结构和三个基本问题

HMM模型通常采用 =(A,B, )表示，对于一个连续混合高斯HMM，定义为如表3-1所示的基本元素的综合。

若图片无法显示请联系QQ752018766

表3-1一个连续混合高斯HMM的基本元素综合

模型参数	说明
N	模型的状态数
A={ }	状态转移概率矩阵＝P[ =j\| ], 1 i,j N
={ }	各状态的起始概率公布， =P[ ]=1, 1 j N
B={ (o)}	输出概率密度函数， (o)= 1 j N

其中输出概率密度函数中参数描述如表3-2所示。

3-2输出概率密度函数中参数描述

参数	说明
O	观察向量
M	每个状包含的高斯元的个数
	第j状态第1个混合高斯函数的权
N	代表正态高斯概率密度函数
	第j状态第1个混合高斯元的均值失量
	第j状态第1个混合高斯元的协方差矩阵

权系数满足下面的条件：

=1, 1 j N (3-1)

这种连续混合高斯HMM通常简称为CHMM。对于每一个状态，都用若干个正态高斯概率密度函数(简称而pdf)的线性综合来表示，每个pdf有各自的均值失量和协方差矩阵，这些都是通过对大量的MFCC参数进行统计得到的。

对于HMM模型，有三个基本问题需要解决：

(1)输出概率的计算问题：给定观察序列O=( , )和HMM模型 =(A,B, )，如何计算观察叙率对HMM模型的输出概率P(O/ )。

(2)状态序列解码问题：给定观察序列O=( , )和HMM模型 =(A,B, )，如何确定一个最优的状态转移序列q=( , , )。

(3)模型参数的估计问题：如何调整 =(A,B, )的参数，以使P(O/ )最大。

3.3前向概率和后向概率－HMM的输出概率计算

3.3.1　HMM输出概率的计算

给定观察序列O=( , )和HMM模型 =(A,B, )，如果已知状态转移序列q=( , , )，则HMM模型又状态转移序列q输出观察序列O概率为

　　　　　　　　　　 (3-2)

HMM模型输出q的概率为

　　P(q/ )= (2-3)

而这里需要的是对所有可能的状态转移序列q，模型输出观察序列O的概率P(O/ )。由全概率公式得：

P(O/ ) = (3-4)

该式需要进行次计算，这在实际中是无法承受的。为了降低计算复杂度，可以采用前向算法和后向算法。

3.3.2 HMM的前向概率和后向概率

首先定义HMM的前向概率为^[6]：

＝P( , , =i| ) (3-5)

表示给定HMM模型参数，部分观察序列{ , }，在t时刻处于状态i的概率前向概率可以用下面的递推公式计算：

(1) 初始化

= 1 i N (3-6)

(2) 迭代计算

1 t T-1,1 j N (3-7)

(3) 终止计算

P(O/ )= (3-8)

与前向概率相对应，还有后向概率。定义后向概率为：

( , , =i| ) (3-9)

表示给定HMM模型参数，观察序列在t时刻处于状态i，系统输出部分观察序列{ , }的概率。

后向概率^[7] (i)也有类似的递推公式计算：

(1) 初始化

=1, 1 i N (3-10)

(2)迭代计算

= 1 t T-1,1 j N (3-11)

前向概率和后向概率的递推关系可用图3－2说明

上一页 [1] [2] [3] [4] [5] [6] [7] [8] [9] [10] ... 下一页 >>

语音信号隐马尔可夫模型仿真第6页下载如图片无法显示或论文不完整，请联系qq752018766

上一篇文章：三文动画在OGRE中应用的研究

下一篇文章：计算机在输电线路中过流保护的应用

语音信号隐马尔可夫模型仿真 第6页

语音信号隐马尔可夫模型仿真第6页