关于人的视觉分析能力原理性研究早已展开,但是还没有取得决定意义的成果。一般认为,人的视觉系统对外界环境的视觉感知分成两个阶段:一个快速的、自下而上的、显著性驱动的、任务无关的阶段和一个较慢的、自上而下的、意识驱动的、任务相关的阶段。人的视觉显著性检测行为就是为了完成自下而上阶段的任务。与人的视觉显著性检测行为相对应,在计算机中,可以通过图像显著性区域检测方法实现图像显著性信息的提取。
与人的视觉显著性检测行为相对应,在计算机中,可以通过图像显著性区域检测方法实现图像显著性信息的提取。图像显著性区域检测研究的目的是获得高质量的显著图,显著图反映了图像中不同区域的显著程度。利用显著图,可以快速定位和处理图像中的显著区域。
显著性区域检测技术有着广泛的应用,在目标自动检测、图像检索、物体识别,图像分割、视频的快速浏览和汇总、图像和视频压缩、图像自动化修剪和内容感知的图像编辑等领域都可以应用。目前显著性检测技术的应用还无法令人满意,除了显著图本身的质量不够高以外,显著性信息应用方式和方法还不够成熟,需要找到更加令人满意的实现方法。
图像显著性区域检测研究的目的是获得高质量的显著图,显著图反映了图像中不同区域的显著程度。利用显著图,可以快速定位和处理图像中的显著区域。显著性区域检测技术有着广泛的应用,在目标自动检测、图像检索、物体识别、图像分割、视频的快速浏览和汇总、图像和视频压缩、图像自动化修剪和内容感知的图像编辑等领域都可以应用。目前显著性检测技术的应用还无法令人满意,除了显著图本身的质量不够高以外,显著性信息应用方式和方法还不够成熟,需要找到更加令人满意的实现方法。
本课题是在国际国内数字媒体信息蓬勃发展的背景下进行的。随着数字媒体产业的迅速发展,利用生物技术、认知科学和计算机视觉的先进理论和方法对复杂多样的媒体内容进行智能分析和处理的需求更加迫切。国际上,美国国家科学基金会和美国商务部在50多名科学家中开展的调查研究表明,本世纪的四大带头科学中就涵盖了生物技术、信息技术和认知科学三大学科。这些学科的结合,将改变21世纪人类的生存方式。从国家层面上看,科技部的973项目计划中已经安排了多个数字内容理解与视觉认知方面的项目,863计划中则安排了基于视觉特征的视觉定位技术和人机交互技术课题,国家自然科学基金委员会新近发布了“视听觉信息的认知计算”重大研究计划。因此,本课题的研究具有重要的实用价值和广泛的应用前景。
1.2 研究现状
在生物学上,视觉显著性问题很早就开始研究。基于计算机的显著性检测研究开始于20世纪90年代。显著性检测处理的对象是图像或者视频。最开始,研究主要集中在如何利用生物学上关于视觉显著性的研究成果,在计算机上建立相似的模型并且采用近似的处理方式来模拟人类的视觉行为。这些模型比较复杂,用计算机实现起来效率不高,检测的效果也比较一般,典型的有Itti等人提出的基于特征集成理论的方法。研究人员逐渐意识到,生物学上对视觉显著性的研究是不彻底的,很多的结论具有猜测性。在这样不可靠的理论上建立的模拟算法很难有可靠的效果。逐渐,很多方法突破的了严格的生物学模型,模型中的很多部分被简化,采用更为简单直接的计算实现。这些算法在检测效果有了较大幅度的提高,典型的算法有Goferman等人提出的上下文集成的方法。多种视觉注意力模型不断涌现,逐渐成为智能图像信号处理领域的研究热点。这些方法可以应用于多个领域,并提升传统方法的性能,包括内容感知的图像缩略图生成、自适应的图像/视频压缩、感兴趣对象分割、对象识别、对象跟踪、智能监控等。 Matlab基于全局对比度的视觉注意模型的比较与研究(2):http://www.751com.cn/jisuanji/lunwen_22340.html