摘要随着自动化系统的推广,手写体数字的识别日益受到人们的关注。由于数字在日常生活中运用广泛,因而对其的研究具有重要意义。本文将UCI机器学习数据库中的0-9十个手写体数字数据作为训练和测试样本,使用最常用的模式识别方法进行识别和对比研究。25325
本文首先介绍了几种常用的预处理和特征提取方法,并选取原始图片实现其功能。然后分别实现了Fisher线性判别、BP算法和支持向量机这三种识别算法,并在此基础上构造了多类分类器。最后从数据库中随机抽取多组数据,经过K-L变换后,对上述三种识别算法进行测试,从算法学习速度、识别率、鲁棒性等角度进行对比,并得出结论。
关键词 模式识别 K-L变换 Fisher线性判别 BP算法 支持向量机(SVM)
毕业论文设计说明书外文摘要
Title Comparative Study of Several Kinds of Commonly
Used Recognition Algorithm of Handwritten Numbers
Abstract
With the generalization of the automatic system,the recognition of the handwritten numbers is paid more attention to day by day.Because numbers are wildly used in daily life,the research on it is of great importance.In this paper,the handwritten numbers from 0 to 9 in UCI machine learning database are used as training and testing samples.This paper uses the most common pattern recognition algorithm for recognition and comparative study.
First of all,several commonly used methods of pretreatment and feature extraction are introduced.This paper uses some original pictures to realize them.After that, the Fisher linear discrimination,BP algorithm and support vecter machines are realized respectively.Then a multiple-class classifier is constructed on the previous basis.Finally,we select several groups of datas from the database randomly.After K-L transformation and testing,we do the comparation from the aspects of learning rate,recognition rate and robustness and draw the conclusion.
Keywords pattern recognition K-L transform Fisher linear discrimination
BP algorithm support vector machines(SVM)
目 次
1 绪论 1
1.1 研究背景及意义 1
1.2 发展历史及研究现状 1
1.3 论文的主要工作及内容安排 2
1.4 开发平台简介 3
2 预处理和特征提取 4
2.1 图像二值化 4
2.2 字符归一化 5
2.3 K-L变换 6
3 识别算法 9
3.1 Fisher线性判别 9
3.2 人工神经网络 10
3.3 支持向量机 11
4 算法实现 13
4.1 样本数据的读取 13
4.2 Fisher线性判别算法实现 13
4.3 BP神经网络算法实现 15
4.4 支持向量机算法实现 19
4.5 多类分类器设计 20
5 实验和比较分析 22
5.1 UCI数据库 22
5.2 实验结果和分析 22
结论 26
致谢 27
参考文献28
1 绪论
1.1 研究背景及意义
光学字符识别(OCR)最早可以追溯到20世纪20年代,现在已发展成为模式识别研究的一个重要分支。光学字符识别通过扫描、摄像等光电非接触方式,将印刷的字符信息转化成图像,应用字符识别技术快速、准确的对图像进行识别,与传统方法相比,极大地减少了资源浪费,提高了工作效率。
手写体数字识别是光学字符识别的经典研究内容,现在已被运用于银行票据的自动录入、财务报表的数据统计、邮政编码识别等领域,有着广泛的应用前景。同时,手写体数字识别又是一个难点,很多时候人们要求对数字进行实时识别,这就意着识别算法需要同时具备学习速率和正确率。 几种常用手写体数字识别算法的对比研究:http://www.751com.cn/zidonghua/lunwen_19039.html