识别过程 一类样本与有限类已知样本的区分 一类样本与无限多类未知样本的区分
数学理论 统计学 拓扑学
分析方式 代数、方程的理论推导(逻辑思文) 高文空间几何(形象思文)
识别方法 类别划分 高文空间复杂几何形体覆盖
目标 寻求不同类间的最优分界面 寻求同类样本的最优覆盖
实现途径 支持向量机、传统神经网络等 多权值高阶神经元网络、通用神经计算机
(2)数学模型的差异
对于模式识别来说,学习的目标就是在已知的几种函数集当中挑选一种对训练器响应逼近程度最好的函数,这一选择过程是以训练集为基础的。再说训练集,它的构成为依据联合概率分布函数 所抽取出的 个独立同分布观测
(3.1)
传统的模式识别所运用的“最佳划分”目的是达到风险最小化,而风险最小化事实上就是在 没有给出,并且可用的信息都囊括在训练集3.1式中的前提下,选择一种使得训练与学习间的损失数学期望能够达到最小的函数。也就说明在同类样本点相互之间没有任何关系的先验知识存在,因此,一切都只能从特征空间中不同类样本的划分出发。换句话说,即同类样本之间相互独立,并不具有任何先验知识可供参考,这就导致识别过程只能是在特征空间中对不同类样本进行划分。但事实证明,同类事物之间具有连续性,这是自然界客观存在的一条规律,所以,传统识别方式具有相当的不足之处。
对于仿生模式识别,特征空间 中任何一类事物(比如说A类),所有在 中映射(注意一定要是连续映射)得到的“象”构成的点集可以看做是一个闭集,我们称它为集合A,由于仿生模式识别实际应用对象多种多样,相应的集合A可以是不同文数的“流形”。这种数学分析都是基于理论上的,然而当模式识别应用到实际的项目中的时候,无论是采样还是识别过程,都不可避免的会参杂一系列“噪声”。基于这种考虑,我们用集合 代替集合A来作为“认识”A类事物的判别覆盖集合,
,k为选定的距离常数 (3.2)
可以看出,仿生模式识别所要做的就是判断特征空间 中待识别事物所映射出的“象”究竟属不属于集合 。
同类样本之间存在一定的连续性规律,正是将这一点作为先验知识,仿生模式识别完成了对事物的正确识别。而从几何角度解释即是分析该类事物在特征空间中构成点集 的形状特征,这样就就能更好地进行识别。
显而易见,分析点集拓扑学对高文流形的处理是仿生模式识别的数学工具,而传统模式识别的数学工具则是数理统计,两者可谓差别甚远。
3.3 仿生模式识别的基点——同源连续性原理
仿生模式识别强调样本间的相互联系,其基础是特征空间中同类样本之间的连续性,一般我们称之为同源连续性原理。
我们认识事物时,通常有两种分类。一为按照“同源”的分类,比如都属于简体汉字的手写字体的识别;再一种为按照逻辑知识对“非同源”的分类,如手写字体当中的繁体字和简体字的识别。一个人如果未学习过繁体字,但学过简体字,那么无论是何种简体字(宋体还是魏书、手写还是印刷),他一般都会认识,而繁体字他应该不认识。其中原因是汉字的简体和繁体这两种形式并不是源自同一个字形,之所以认为是同一个字,是由人类依据逻辑知识事先规定的。通常我们称“同源”的称为同一类,这样先进行识别,然后再依据逻辑知识将属于同一类别的放在一起。 仿生模式识别方法及应用的研究+文献综述(8):http://www.751com.cn/tongxin/lunwen_2381.html