目前普遍认为视觉注意力的驱动存在两种方式:自底向上和自顶向下。自底向上的视觉注意力受图像数据所驱动:当视觉场景中的区域与周围区域存在足够的反差从而自动突显出来,吸引人们的注意力,这种感知特性称为显著性。而自顶向下的视觉注意力受高层认知因素所驱动,与大脑的知识、期望和当前视觉目标有关。
在过去二十年中,国内研究者在不同学科领域提出了多种视觉注意力或视觉显著性检测的计算模型。这些模型要解决的问题是如何准确地预测视觉场景中能够吸引人眼注意的区域。其输出结果一般是一种被称为显著谱或注意主图的二文灰度图,图中越亮的部分表示越突出或越容易引起人眼注意的区域。与视觉注意力的两种驱动方式相对应,这些显著性检测模型也可以大致划分为自底向上和自顶向下两大类。
数据驱动的自底向上注意力模型与高层次因素无关,通过提取低层次特征(如亮度、颜色、对比度、运动等)来对自由视觉活动的早期注意过程进行建模。按照计算方式的不同,自底向上的方法可以主要分为基于局部对比度和基于全局对比度,本文主要研究基于全局对比度的视觉注意力模型。
基于全局对比度的方法通过整合整个视野中的所有信息来检测显著性。这类方法在计算每个像素或区域的显著值时,需要将当前像素或区域到图像中所有像素或区域的对比度进行求和,运算量较大,需要采用一些简化的近似方法来降低运算复杂度,比如:Zhai和Shah提出的计算某个颜色通道的一文直方图的方法,以及Cheng等提出的颜色空间量化,进而计算量化颜色直方图的方法等。此外,Achanta等通过频率调谐分析,将中心-外周对比度简化为图像颜色均值与当前像素颜色距离的高斯模糊,从而大大提升了计算效率。
近年来,基于全局对比度的方法正从以像素为处理单元向以区域或超像素为处理单元转变。这样,不但能提升计算效率,还能使生成的显著谱更均匀地突出显著对象。
一般来说,基于全局对比度的方法可以生成具有全分辨率、边界清晰和均匀的显著谱,非常适合提取显著对象。但是现有方法通常对所有像素的对比度都同等对待,并未采用加权和侧重,从而易于将大的显著对象检测为背景。
1.3 图像显著性检测方法面临的挑战
经过二十年的研究,已经产生出多种图像显著性检测方法,并在图像处理和计算机视觉的很多领域得到了应用。但是,随着研究的深入,由于人类对自身的认识以及视觉计算条件的局限性,图像显著性检测及其相关研究面临的困难和挑战也日益增加,主要表现在以下几个方面:
(1)视觉注意力机制以及相关研究成果需要有效地融入模型中
图像显著性检测时一个多科学交叉的研究领域,涉及生理学、神经心理学、认知科学、计算机视觉等多个科学。在计算机视觉方面,已有研究通常根据具体任务而建立计算模型,难以将其他学科的研究成果有效地融入到模型中。
(2)基于全局对比度的方法存在面积依赖问题
基于全局对比度生成的显著谱虽然具有全分辨率、边界清晰和均匀的优点,但是传统方法在计算像素显著值,简单地将当前像素到其他所有像素的颜色距离进行求和,存在着易于将大的显著对象检测为背景的问题。
(3)不同的分割结果影响了基于区域的显著谱的一致性
近年来,基于区域或超像素的方法展现出在计算效率和提取显著对象方面的优越性,但是,这些方法获得的显著谱取决于分割结果。如果分割结果刚好把显著对象分割为一个区域或超像素,这些方法能够很好地检测到该对象。但是,如果分割结果把对象分割为多个区域或将对象和背景分割为一个区域,这些方法往往不能取得的效果。 Matlab基于全局对比度的视觉注意模型的比较与研究(3):http://www.751com.cn/jisuanji/lunwen_22340.html