基于局部视觉特征的图像识别研究(2)

致谢 23
参考文献 24
1. 绪论
1.1 研究背景及意义
当今的时代，图像数据日益增加。一方面，随着照相机等设备的普及，以及如手机等设备拥有了拍照的功能，越来越多的人们习惯于将日常生活的一些信息以图像的形式存储，并且，随着社交网站的普及，人们倾向于将这些图像放到网络上与他人分享。这无疑使网络上的图像数据急剧增加。另一方面，许多人或公司采用摄像头等进行监控，每天都产生大量的图像数据。除此之外，人们越来越多地将工作或研究的成果以图像的形式表示，又进一步增加了图像数据的量。
尽管图像数据与日俱增，与之相应的获取信息的方面却相对落后。虽然人类对于图像信息的获取能力很强，但对于计算机而言，要获得相应的信息却很不容易。正如数据挖掘中的概念：数据量大，但信息量少。与日俱增的数据量与人们在其中获取信息的需要成了一对关键的矛盾。而图像识别正是解决这一矛盾的一个基础工作。
图像识别对于视觉分类的学习及对新物体进行归类的关键问题。当前几乎所有的视觉工作都依赖于对物体、场景的识别、分类的能力。而由于诸如人工智能与信息获取等各个领域的应用对于视觉识别都有需求，能否开发出快速、有效、健壮的图像识别算法至关重要。现今图像识别运用较广的一些领域有：基于内容的图像搜索、视频信息挖掘及移动机器人的物体识别等。
1.2 图像识别的内容及方法概述
一般而言，图像识别有两种类别：具体物体的识别和一般分类的识别。在具体物体的识别的情形下，我们要识别一些具体的物体，如长城、可口可乐的商标，或是某个人的脸等等。相反的，在对一般分类的识别中，我们要识别一些属于某个分类的物体，如车、茶杯或者树等等。本文更多应用于对具体物体的识别。
在图像识别的发展过程中，产生了两种主要的方案，一种是基于全局特征，另一种便是基于局部特征的。
全局特征是将整幅图像作为一个研究对象。最直接的表示就是以某个规定的顺序记下每个点的像素值（见图 1(a)）。如果我们能假设图像照我们感兴趣的物体裁减，且物体是以某个姿态排列的，那么对于同一个物体而言，每幅图像同一位置的像素值应该差不多。因此，可以将图像的灰度值当成是高文表示空间上的一个点，且两点之间的欧式距离就反应了整体的相似度。

图 1：一个外观窗口的完整性描述可以根据它的顺序(a)，也可以是无序的(b)的亮度形成。(a)图中，图像的有序亮度列表被当作是高文空间的点，相似的图像在各个文度上会有相似的值。(b)图中，图像被映射到灰度直方图上，而特定的模式就确定了物体的分类。
由于现在的多数方法都已转向对局部特征的处理，我们对全局特征的讲述仅限于此。
基于局部特征的算法是将图像中的一些局部信息作为图像的描述。尤其是局部不变特征的检测算法及描述算子的开发更是对图像识别的研究有着具大的影响。基于这些特征，人们开发出了适用于不同观察条件及部分遮挡情形下的健壮且高效的检测算法。该方法的一个形像化描述如图 2所示。基于局部特征的算法一般分为三个步骤：
1. 检测兴趣点并生成特征描述符
2. 对生成的特征描述符进行匹配
3. 对匹配成功的特征进行几何检验

图 2：基于局部特征的检测程序形像化表示。独立地从两幅图中提取局部特征，之后将它们的描述符进行匹配操作，找到潜在的匹配对。最后再进行几何检测，看这些特征出现的几何位置是否一致。基于局部视觉特征的图像识别研究(2):http://www.751com.cn/jisuanji/lunwen_6448.html