2.4.3 模式识别—动态时间归整(DTW)[3]
动态时间归整(DTW)算法和隐含马可夫模型(HMM)是目前应用的比较广泛的两种模式识别算法。
DTW算法是一种模板匹配的算法,考虑了个人说话时间上的差别,即对于同一个词,不同人在不同时刻说的时间长度上的不同做了考虑。设参考模板特征序列为A = { a1, a2, …… ,aI },输入语音特征矢量序列为B = { b1, b2, …… ,bJ },I≠J。DTW算法就是要寻找一个最佳的时间规整函数,使得语音输入B的时间轴J映射到参考模板A的时间轴I上,使得总的累计失真最小。
2.4.4 语音模板的训练
要运用DTW算法进行语音识别,首先得到一个比较可靠的模板。模板的好坏,直接影响系统的识别能力。目前,比较常用的方法是用多次采样聚类的方法。基本算法是,首先采样得到多个不同的样本(样本要求尽可能的能够代表所需要识别的对象群体);然后,对于所得到的数据进行特征提取;作DTW以及DTW回溯,对回溯落到同一帧的所有特征矢量进行聚类;将聚类结果作为系统的语音模板。
3. 系统硬件
系统硬件电路主要分为以下几个部分:
1)通讯电路模块[4]:主要实现语音数据对PC的传输;采用AMD3311。TXD0,RXD0接入DSP的SCI0。
图3:通讯模块
2)麦克风及采样电路:采用LM324作为放大电路核心,麦克风采用价格低廉的单一指向驻极电容。放大后信号输出到DSP的ADC端口转换成8位有效数据。
图4:麦克风及采样模块
3)表演模块:采用TOSHIBA240*64图形LCD模块(TLX-1781-C3B)演示系统处理情况及识别结果;表演模块独立于其他模块;可视情况选择安装。
图5:LCD引脚
4) LED模块:用来标志系统状态。
图6:LED的连接毕业论文http://www.Lwfree.cn/
5) 核心模块:DSP56F805芯片为核心处理及控制器。[4]
图7:模块框图
6)电源电路:电源电路主要由三个部分组成
放大与采样电路供电。由于对采样的特殊要求,为了提高采样的精确度,系统对采样电路和DSP电路采用分别供电的方法。
图8:放大与采样供电电路
DSP供电电路。
图9:DSP供电电路
LCD供电电路。LCD要求有可调的负电压供电,以调节液晶的显示亮度。
图10:LCD Vee 供电电路
4. 系统软件
软件主要由一系列子程序模块构成;分为PC端子程序和DSP端子程序两类。
4.1 系统子程序4.1.1 DSP端子程序