传统的图像检索技术是基于文本的。70年代末的时候,人们注释图像的方法是手工的,之后根据关键字/词进行图像检索。此技术被很多大型的数据库使用着。所有这些图像的索引都由人工标注。但是这种图像检索方式主要有以下两个缺陷:一是对大规模的图像数据库一一进行人工标注的代价太大;二是图像中含有各式各样丰富的信息,不同的个体对于不同的图像都有着不同的理解,标注过程中会出现主观和非精确性。
因此人们开发出基于内容的图像检索。图像的特征便是图像的内容,基于内容的检索方式主要是让两幅图像进行特征的匹配,也就是说进行图像特征的相似性度比较。想要比较相似度第一步就是提取图像的特征。图像的特征分为低层的物理特征(如颜色、纹理、形状等)和高层的语意特征。大部分的高层特征都是由人工注释的,也就是基于文本的图像检索方法,但是想让此方法自动化就有着比较大的困难,因为人工注释的主观性非常强,不利于标准化的实现。而低层次的纹理、颜色、形状特征就相对来说容易提取一些,也能客观一些的反映图像的差别。
目前有很多特征提取方法,有些方法在实际问题中取得了较好的效果。但是这些方法大部分都存在一定的缺点与不足,有些方法含有不唯一解,有些方法对训练样本有着很强的先验假设。在此基础上,有人提出了子空间分析方法,其思想是把高文空间里松散分布的样本,使用线性变换或非线性变换降文到一个低文子空间中,样本在低文度的空间中分布得会更加紧凑,同时这样也方便了人们对样本分类,让计算变简化。现在有很多子空间分析方法。目前很多研究人员在参与研究CBIR的图像检索方法,并有许多成果出现,本文也不一一列举了,本次设计主要是抱着学习并应用的态度来研究以有的一些检索方法。
1.2 基于内容的图像检索技术的发展现状
1.3 本文的研究内容与方法
本文介绍了几中先进的基于内容的图像特征提取算法。同时采用基于纹理特征的图像检索方法和基于PCA原理的图像检索算法进行系统仿真实现。本文设计了一个含有400张图片的图库,并利用上述两种算法进行系统的编写,最终给出一张图可以从系统中匹配出最相似的9张并按照相似度顺序排列出来,同时用GUI界面进行成果展示。同时得出PCA算法相对于纹理算法更加优化。
1.4 本章小结
本章节作为本篇文章的铺垫部分,重点介绍了此研究课题的选题背景和基于子空间的图像检索的发展状况以及发展前途,同时提出了本设计的研究内容以及方法并简单介绍了本设计检索系统的功能。
2 算法简介
2.1 几种常用的线性子空间分析方法
2.1.1 主成分分析(Principal Component Analysis,PCA)
主成份分析即PCA,也被称为K.L变换,是非常经典的子空间分析方法[2]。它的原理是取一投影映射P,把样本文度降低,从N文空间降低到m文子空间,并尽量保留样本的能量。它也是数学上处理降文的一种方法。
主成分分析算法的具体步骤是,假设原本有数个具有一定相关性的指标(P个),将这些指标重新组合成一组综合指标并且彼此之间无相关性。在数学中,一般会将原本P个指标作线性组合,作为新的综合指标。最典型的做法是用F1(选取的第一个线性组合)的方差来表达,F1越大,表示F1所含有的信息越多。因此在所有的线性组合中选取的F1(线性组合)应该是方差最大的那个,因此 F1称作第一主成分。如果F1不足以代表原来P个指标的信息,再考虑选取F2即第二个线性组合,F1已有的信息不需再出现于F2中,即Cov(F1,F2)=0,将F2命名为第二主成分,以此类推可以构造出第三、第四……第P主成分[3]。 MATLAB基于子空间的图像检索技术的研究(2):http://www.751com.cn/tongxin/lunwen_19127.html