1.1.2 国内外现状
1.2 基于稀疏表示的人脸识别的研究背景与进展
1.2.1 研究背景
稀疏的思想一直是推断工作的指导原则。对于高文的数据处理工作,往往需要寻求一些只依赖于一部分观察值的模型,这些模型会选择一些小的特征子集来进行分类工作,例如Sparse PCA[25](稀疏主成分分析)。从某种意义上来说,这种稀疏特征的选择方法与SVM[26](support vector machine,支持向量机)选择训练样本小的相关子集,对不同类别的边界进行描述的方法是对偶的。这些工作都有一个共同的特点,利用稀疏的思想,选择一个有限的特征子集或者从训练集中选取一部分样本,而不是直接利用全部的数据进行表示或分类工作。
稀疏表示最开始应用于信号处理领域。为了获得信号更为简洁的表达方式,利用稀疏表示的方法可以在给定的超完备字典中用尽可能少的元素来表示信号[2]。在此过程中由于选择的基是具有辨识功能的,因此一些分类和推理工作(例如人脸识别)可以借助这个过程展开。
1.2.2 研究进展
自稀疏表示理论运用到人脸识别领域以后,研究人员对其做了很多的改进与拓展。目前主要的稀疏表示模型有SRC[2](Sparse Representation-based Classification,基于稀疏表示的分类法),该方法将测试图像看作训练集的线性表达,并且利用L1范数来进行稀疏系数的计算。同时该模型假设其残差满足高斯或者拉普拉斯分布。相较于一些传统的分类方法,SRC模型不仅比较了测试类与训练集中其他类的差异,还利用了训练集中的所有类别来计算稀疏系数。不仅如此,SRC模型淡化了特征提取,并且对于遮挡具有良好的鲁棒性。
RSC[3](Robust Sparse Coding,鲁棒稀疏编码),与SRC方法不同的是,RSC模型寻求的是稀疏表示问题中的极大似然解,这使得RSC方法比SRC方法有着更好的鲁棒性。在处理表情、光照变化以及遮挡问题时RSC方法也有着良好的效率。
稀疏表示理论最初提出时缺乏相应的理论支持,文献[10]对SRC模型进行了相应的理论分析,指出L0优化只能满足稀疏性,而L1优化可以同时满足稀疏性和紧密性,即在非零表示系数数量少的情况下,使得系数集中在与测试样本属于同一类别的训练样本中。文献[5,7]将稀疏表示与信息论相结合,提出了基于熵理论的稀疏表示方法。文献[9]则将马尔科夫随机场引入稀疏表示理论的体系框架中。
除此之外还有基于结构稀疏的人脸识别,基于半二次迭代最小化的稀疏表示[19]等。对于稀疏表示在图像分类中的应用也有更深入的讨论,一些相关的研究学者质疑了稀疏性在图像分类中所发挥的作用[6,11],指出了稀疏性约束条件也存在不能显著提高识别效果,以及计算率过高的问题[6]。
1.3 基于稀疏表示的人脸识别研究内容与研究方法
1.3.1 研究内容
人脸识别技术可以基于人脸特征,对输入的图像或视频资料进行检测,判断其中是否存在人脸。存在人脸时,可以进一步提取每个人脸中的身份信息,通过将其与已知人脸进行对比和匹配,从而识别每个人脸对应的身份。其流程如图1.1所示:
图1.1 人脸识别基本流程
其中人脸检测是指对于给定的一幅静态图或视频图像序列,利用一些策略和方法进行搜索以确定其中是否包含人脸。搜索过程中同时给出人脸在图像中的位置、姿态和大小等信息。
预处理阶段需要对图像进行优化。采集到的图像往往存在噪声、光照等污染,通过预处理过程可以降低这些不良因素对图像质量以及后面匹配过程造成的不良影响。 求解几种稀疏表示模型的ADMM算法研究(3):http://www.751com.cn/shuxue/lunwen_19019.html