实际上,人们真正感兴趣的信息只占大量图像视频数据中很少的一部分。如何从这些数据中快捷、准确地获取重要的有用信息以用于分析和处理,已成为智能媒体处理领域面临的重要挑战。图像显著性检测的任务就是要解决如何从海量图像数据中准确地找到人眼关注的重要区域或对象的问题。因此,对图像显著性模型理论与方法进行深入研究,对于提高媒体数据的获取、处理与传输效率,提升媒体处理与分析技术的水平,都具有非常重大和深远的意义。
人类每秒钟接收和处理的可视媒体数据(108 ~109比特)大大超过了计算机系统的处理能力。如果不是借助于一些“巧妙的”机制来减少数据处理量,要实时处理如此庞大的数据是不可能完成的。而视觉注意力(visual attention)正是人类和地球上的很多生物经过漫长的进化所获得的一种“巧妙的”处理机制。正如美国心理学之父——William James 所说,“每个人都知道注意力是什么”,注意力是如此自然和简单,以至于每个人、每只动物乃至每一只小昆虫都拥有注意的能力。虽然所有人都“知道”注意力是什么,但19 世纪之前,很少有人分析和研究注意力。人们在面对一个复杂场景时,能够迅速选择性地找到“重要的”或“感兴趣的”区域,而忽略其他不重要的部分,这种认知能力称为视觉注意力。视觉注意力是生物为了能迅速地觉察到猎物或潜在的危险而进化形成的一种天生能力。更重要的是,通过视觉注意力机制,视觉系统可以有选择地着重处理进入视野的海量信息中最重要的部分,从而打破大脑和视觉系统处理信息的瓶颈。这正是许多现代计算机系统亟待解决的问题。
近年来,人类的视觉感知和注意力机制受到国内外研究者的广泛关注。在现有数字媒体计算体系中,结合信息的认知机理和人工智能,寻求媒体数据的智能信息处理新方法,以及对媒体数据进行智能化的压缩与传输是目前学术界关注的重要方向。在该领域取得突破性进展将为数字媒体信息技术的深度开发和广泛应用创造非常有利的条件。
但是,使计算机系统模仿人类视觉系统(human visual system,HVS),具有智能的视觉感知和分析能力,是一个十分困难的问题,面临着许多挑战。其中最重要的挑战是,视觉注意力是一个多学科交叉的研究领域,涉及生理学、神经心理学、认知科学、计算机视觉等多个学科。在生理学和神经心理学方面,对视觉注意力的研究还处于探索阶段,很多研究结论是通过一些假设而总结出,还需要物理实验的验证。认知科学本身也面临着七个方面的挑战:大脑的挑战、情感的挑战、意识的挑战、身体的挑战、世界的挑战、动力系统的挑战以及社会的挑战。而在计算机视觉领域,很难将生物学领域所得到的结论和模型进行实现,并引入到具体计算中,往往是将生物学模型进行了简化,采用了更直接的计算模型。这些学科领域目前并没有一个比较完整统一的理论框架。
视觉注意是一种引导视线注视到场景中感兴趣物体的机制。一般情况下,进入人眼视野的视觉信息是海量的,视觉系统无法并行处理所有信息,同时也不是所有信息都是同等重要的。通过视觉注意机制,迅速选择少数几个感兴趣对象进行优先处理,视觉注意的作用象信息处理中的数据筛选过程,优先让感兴趣的部分信息进入视觉感知和暂时记忆,并停留足够长的时间,使观察者能感觉到。从生理学方面而言,视觉注意是灵长目类动物视觉系统经过长期的进化演变形成的,为了觅食、避敌等生存和繁衍的需要,需要视觉系统对获得的视觉信息进行实时的、有选择性的进行处理,迅速从大量的视觉输入信息中发现食物或敌人,即能选择性注意;从心理学方面而言,视觉注意强调了人类心理活动的主动性和意识的重要性,将注意作为大脑信息处理的重要机制。 基于局部对比度的视觉注意模型的比较与研究(2):http://www.751com.cn/jisuanji/lunwen_22306.html