摘 要:近年来数学符号识别已成为人机交互领域研究的热点之一,本文对数学符号识别中特征提取和识别方法进行了分析研究.在一般识别方法的研究基础上,提出了一种基于支持向量机的数学符号识别方法.在模拟的数学符号图像库上进行实验,结果表明此方法是有效可行的.56255
毕业论文关键词:数学符号,识别,支持向量机
Abstract: Recently the mathematical symbols recognition has become one of the research issues in the field of human-computer interaction. In this paper, feature extraction and recognition method are analyzed. After the research of ordinary recognition method, a approach for mathematical symbols recognition based on support vector machine is presented. In the simulation of the mathematical symbols image database for experiments, the result indicates that this method is effective and feasible.
Keywords: mathematical symbols, recognition, support vector machine
目 录
1 引言…4
2 常见分类器简介…4
2.1 贝叶斯分类4
2.2 神经网络…4
2.3 支持向量机5
2.3.1 分类超平面…5
2.3.2 线性可分支持向量机5
2.3.3 非线性可分支持向量机…7
2.3.4 支持向量机算法的基本步骤…7
3 手写体数学符号的识别…8
3.1 数学符号的特点分析…8
3.2 图像预处理8
3.3 目标图像的特征提取…8
3.3.1 变换的理论8
3.3.2 基于 变换的特征提取…9
3.4 支持向量机分类器设计10
4 实验结果与分析11
4.1 样本准备…11
4.2 实验结果…12
结论17
参考文献…18
致谢19
1 引言
数学表达式在很多领域都会用到,越来越多的人希望通过计算机来检索、运用其中的数学公式.因此数学符号识别成为了人机交互领域研究的热点,目前手写体数学符号的识别技术已有了飞速的发展,但有待进一步的提高.
支持向量机是由 领导 & 实验室研究小组在1963年提出的一种新的非常有潜力的分类技术,是一种基于统计学习理论的模式识别方法.到90年代,统计学习理论 的实现和由于神经网络等较新兴的机器学习方法的研究遇到一些困难,比如如何确定网络结构的问题、过学习与欠学习问题、局部极小点问题等,使得支持向量机得到了迅速发展和完善,现在已经在许多领域都取得了成功的应用.
本文将探讨手写体数学符号的特征提取和识别问题.主要是利用 变换方法进行特征提取,再运用支持向量机进行识别.其中还研究了手写数学符号的图像预处理等问题.
2 常见分类器简介
2.1 贝叶斯分类器
贝叶斯分类器是指通过某个对象的先验概率,并运用贝叶斯公式将后验概率计算出来,把有最大后验概率的类作为该对象所属的类[1].
贝叶斯分类器的实质为分类的贝叶斯网络.该网络中有类结点B,其中B为类集合 的取值,还包含一组结点 ,是用于分类特征的表示.而贝叶斯网络分类器,若有一待分类样本 ,其分类特征值为 ,则样本 属于类别 的概率 满足:
由贝叶斯公式可得:
其中, 可由领域专家的经验得到,而 和 的计算则较困难.
2.2 神经网络
神经网络,又被称为多层前馈神经网络,是一种非线性映射人工神经网络.
神经网络的工作机理如下:在正向计算输出过程中,输入信息首先传播到隐含节点上,经过各单元的特性为 模型的激活函数运算后,把隐含节点的输出信息传播到输出节点,最后给出输出结果.在正向计算输出过程中,每一层神经元的状态只影响到下一层神经元网络.如果得不到实际的输出,则转入到误差反向传播过程,将误差信号沿原来的连接线路返回,通过修改各层神经元的权值,逐次向输入层传播并进行计算,再经过正向计算传播过程进行计算.反复运用上述两个过程,当误差信号达到所允许的范围之内时,其学习过程就结束了[2].