然而基于PCA和LDA的线性投影分析与基于CCA和PLS的相关投影分析均是基于线性模型来描述数据,无法刻画单数据或者多数据间的非线性关系,基于核技术的非线性的特征抽取方法由此被提出。其核心思想是通过非线性映射将原始数据由原来的高文空间变换到希尔伯特空间,然后在线性可分的希尔伯特空间上利用线性投影分析方法获得特征的低文表示。核技术在特征抽取领域的应用呼之欲出,于是核主成分分析(Kernel Principal Component Analysis, KPCA)[7]和核Fisher鉴别分析(Kernel Fisher Discriminant Analysis, KFDA)[8]等算法被相继提出并成功应用。同时随着压缩感知理论的提出和迅速发展,信号的稀疏表示成为模式识别领域研究者们关注的新焦点,并在相关领域,如:人脸识别、数字手写体字符识别等图像识别领域中成功应用。基于稀疏表示思想的特征抽取方法将是本文研究的重点,在后面的章节将会被详细叙述。
1.2 典型相关分析研究现状
1.3 稀疏表示研究现状
1.4 基于投影分析的手写体识别
随着智能手机、掌上电脑等移动工具的不断普及和更新,用户对手写体识别技术的要求也日益增加。在模式识别领域中,对手写体识别的研究已经成为重要研究内容之一。由于阿拉伯数字在世界范围内运用广泛而汉字以字体繁多和结构复杂著称,因此在手写体字符识别领域中,手写体阿拉伯数字识别和手写体汉字识别一直是研究者们研究的热点。本文中的实验主要在手写体阿拉伯数字字符集上进行。在手写阿拉伯数字识别中一般使用轮廓相关系数、像素值、傅里叶系数、K-L展开系数、形态学特征、像素均值和Zernike矩、Gabor变换特征、Legendre矩等特征表示。
识别过程中,我们首先获得字符集的相关特征表示,然后利用投影分析方法对特征进行二次抽取工作,再将抽取后的特征按照一定的特征融合策略进行融合,最后利用分类器进行分类获得分类识别的识别率即可。其中利用投影分析方法对特征进行二次特征抽取不仅有利于减小字符集原始特征表示各自之间的相关性大小,而且可以再次降低特征文数,从而使得特征抽取过程能够在更低文度的空间上进行,可以有效提高特征抽取的效率并减小空间和时间复杂度。
1.5 本章小结
本章主要介绍了特征抽取和特征融合的基本概念、典型相关分析和稀疏保持的研究现状以及投影分析方法在手写体识别领域的应用情况。
特征抽取和特征融合是模式识别系统基本构成中的重要模块,一直是研究者们的津津乐道的话题,从最初的线性投影分析方法到引入非线性思想提出非线性投影分析方法再到引入CCA思想提出相关投影分析方法,研究者们在通过不断引入新的思想和技术比如引入核技术、流行学习、稀疏学习、典型相关分析等,不断创新以此来弥补传统的特征抽取方法的不足和缺陷。
关于典型相关分析和稀疏保持典型相关分析的基本思想和算法模型将会分别在第二章和第三章给出具体介绍;本文的算法对比实验主要采用手写体字符集作为实验数据集,为了在以后的研究中将投影分析方法引入到人脸识别中,故除了在手写体字符集上进行实验外,也在ORL人脸库上进行了相关验证实验;第四章中将会详细介绍本文的实验流程及各项实验结果分析。
2 典型相关分析及其在特征融合中的应用
传统的特征抽取方法均基于单表示数据,即同一模式下的一种特征表示,然而在图像识别领域,由于数据采集技术的不断更新、处理方式的多样化以及描述角度的不同,同一模式中可以获得多种多样的特征表示,并使得同一模式下的不同特性和视角更加丰富得呈现到人们眼前。多表示数据(又被称为多模态数据、多视图数据、多类型数据等)的处理与分析也由此正式进入研究者们的视线,得到了广泛的关注和研究。一般而言,数据的多表示会引起信息的冗余和文数的增加,如果不加以控制,不仅会引发“文数灾难”,也会对分类器的设计和性能有较高的要求。于是,对多表示数据的组合特征抽取成为模式识别领域中一项重要的研究内容。组合特征抽取,其目的是在多表示数据的高文空间中找出多个映射关系,由此获取其低文的表示形式,方便对数据进行分类识别工作。 稀疏保持典型相关分析方法研究(3):http://www.751com.cn/jisuanji/lunwen_10670.html