(4)缺乏嵌入对象语义特征的有效方式
传统的基于对象特征的显著性模型中,虽然运用对象检测方法来获得特定对象的位置,但必须要给出具体搜索目标和某种特定类别的对象。而实际场景中的对象类别千差万别,传统方法难以对所有对象都能有效地检测出,缺乏嵌入对象得一般语义特性的有效手段。
(5)对图像语义的理解缺乏有效途径
虽然在过去十多年间,计算机视觉和图像处理方面的研究取得了长足进去,但是媒体底层特性与高层语义之间的语义鸿沟仍然没有很好地解决。如何将视觉感知特性应用到对图像语义内容的理解中,还缺乏有效的手段。
2. 相关技术的介绍和分析
注意力是使人类在复杂世界中能够高效地做出某种行为的一种非常重要的感觉机制。人们每一瞬间都在感知大量的信息,但是只有相对很少的信息能被大脑详细地处理。这种在早期处理阶段,将大量感知输入信息的有关部分进行提取的能力是非常重要和关键的。将人的感知处理资源指向感知输入的潜在最相关部分的这种机制成为选择注意力。虽然注意力的概念存在于所有感官,本论文主要关注视觉注意力,只涉及对图像的处理。
视觉注意力的研究涉及许多研究领域,如生理学、神经科学、心理学和计算机科学。在计算机科学领域,人们对视觉注意力建立了很多计算模型。为了使所建立的模型能够很好地反映人的视觉认知过程,有效地完成对人眼视觉位置的预测和对显著区域的检测提取任务,研究人员必须要掌握视觉注意力的机制以及相关领域的基本知识。
图像显著性区域检测过程可以分成三个基本的步骤:(1)特征抽取:从原始的图像(一般是RGB图像)中抽取多种形式的特征,这些特征有最为基本的颜色特征,也有复杂一些的形状、方向等特征。(2)特征显著性计算:利用一个或者多个特征,在一定的视觉显著性规律指导下,计算特征显著性。(3)特征显著性融合:将多种特征显著图,在视觉显著性规律的指导下,合成图像的显著图。
显著性检测方法可以使用一种图像特征,也可以使用多种,各有利弊。同时使用多种特征计算显著性,然后将多种特征显著图结合在一起,可以很好的克服某一个特征导致的不合理显著区域,这些不合理的区域在其他特征中就很可能不具有显著性,这样这些不合理的区域可以被抑制。但是多种特征一起参与计算,很有可能会得到相悖的结论,这都需要更加复杂的合成算法以保证在对特征显著性进行组合时能够更加符合人视觉的特点。由于这个原因,很多算法只使用一种特征,这样就省去了特征显著性融合步骤。
图像信息十分丰富,当人观察一幅图像时,视觉系统接收了非常丰富信号,这些信号给予视觉系统多样化的刺激。为了能够更好的分析各种刺激,人的视觉系统采用了很多的方式来对信息进行过滤和分解,这种行为就是从图像丰富信息中提取出不同种类的特征。然后视觉系统根据需要计算某些特征的显著性。视觉特征反映了外界环境对人眼的刺激,要对人眼接受的信号或者对图像内容进行全面合理的建模本身就是个难题,研究人员不得不找到多种形式的特征来表现图像不同方面的性质。特征的多样化导致了计算的增加,这也就促使研究人员寻找最高效的特征来进行显著性计算。 Matlab基于全局对比度的视觉注意模型的比较与研究(4):http://www.751com.cn/jisuanji/lunwen_22340.html