图像检索分类及关键技术目前的图像检索技术主要分为基于文本和基于内容的(CBIR)。基于文本的图像检索如上所述,主要依赖于标注信息。而基于内容的图像检索,是用在图像上提取到的特征来表示图像的内容,代替基于文本检索中的图像的标注信息来进行图像检索的。28897
基于内容的图像检索的步骤基本为:首先,对图像集里的图像进行特征提取,并将特征向量[19]存储起来;然后,对查询图像也进行特征提取;最后,将查询图像的特征向量与图像集里的一一比较,计算相似度。而检索的关键一步是特征的提取,因为特征对图像的表示越准确,检索的效果会越好。特征提取又可分为:基于颜色、纹理、形状特征的检索系统。
①基于颜色特征的图像检索是用颜色直方图[2]来表示图像。因为颜色特征不受到图像平移、旋转等变化的影响,具有一定的稳定性。其基本思想为将设定好的颜色空间平均分成许多小区间,代表颜色直方图中的一项。然后用该直方图来统计图像的颜色像素信息。即可得到图像的颜色直方图,通过计算直方图相似度实现检索。另外,为了使颜色特征更好的表示图像内容,还可以先对图像进行分割处理后,再在图像子块内提取图像的颜色特征。因为分割区域后,能够对图像有更高层次上的分析。论文网
②对于图像纹理的定义一直是备受争议的,根据不同的描述角度,不同的应用背景,可以进行不同的定义。但是他们的共通点是:纹理特征表现为图像中像素点之间的相关性[5]。对于纹理特征的提取,现在的主要方法为:第一,基于Gabor的小波模型以及在此基础上的各种改进算法[6],使纹理特征具有平移、旋转不变的特点。第二,基于灰度共生矩阵[18]的特征描述。它主要是通过图像的四个统计量参数来表示图像。第三,基于傅里叶变换来生成纹理特征。它只用到了四个统计量中的一个——能量,而且它是基于将频域分割成多个扇形区域,这样使得对能量参数的描述更准确,提高了检索的准确率。
③形状特征的描述方法主要分为:基于轮廓的形状和基于区域的形状。轮廓顾名思义就是图像的边界、边缘,它通过各种边缘检测算子,如Roberts、Sobel算子,检测图像边缘点,并且可以通过计算得到对应的方向,从而得到关于方向的直方图。区域则表示的是整个图像,它的特征提取方法有很多,比如几何矩、傅里叶描述子等等。为了使检索效率更好,可以使用将轮廓形状和区域形状相结合的方法,达到互补。
此外,还有刚刚兴起的基于情感语义的图像检索。因为人们对图像的理解受到自己情感经历的影响,是具有主观性的。因此,希望在此基础上能够得到图像的高层情感语义。因为基于内容的图像检索的依据是图像特征,没有考虑“人的因素”——也就是人们对图像的理解,造成了所谓图像上的“语义鸿沟”。而基于情感语义的图像检所就是希望弥补这误差,提高检索效率。
在空间关系的检查上,也提出了几种方法。①捆绑法。将图像一定区域内的特征捆绑起来进行匹配,不再是单个特征之间的匹配关系[15]。②E-WGC(enhanced weak geometry consistency, E-WGC)[11]。用相互匹配的特征对的尺度变化和角度变化来预测彼此的位置,用所有局部特征对预测出来的位置和实际位置的距离来衡量两幅图像的空间关系的一致性。③强几何一致性(SGC),根据匹配对的旋转角度划分为不同的组,组内求主位移,然后去除组内和主位移差异大的匹配对,用剩余匹配对最多的组来衡量图像的相似度[8]。④空间关系编码,编码能进行匹配的特征点的相对位置。在本文的第四节将进行说明。 国内外图像检索技术研究现状:http://www.751com.cn/yanjiu/lunwen_23921.html