立体视觉是由美国MIT的Robert所进行的关于三文景物分析的课题而诞生的概念,他把二文图像扩展成了三文景物,这项技术因此诞生。70年代中期Marr等学者提出了一整套理论来阐述其过程。到了80年代后期,立体视觉研究的发展的着重点落在了移动式机器人身上,所采用的方法是空间几何及物理知识,所要完成的任务为识别处理道路障碍。上述研究促进了其他领域的发展,这些领域包括对照片的处理、精确制导、立体视觉导航、医学诊断、绘制地图等。众所周知,计算立体视觉的过程包括751个部分:图像获取,摄像机标定、特征提取、立体匹配、深度确定及三文重建[2]。由于光线条件、物体形状及噪音干扰等原因,立体匹配成了众所周知的难题。26349
国内的研究现状是在基于特征的选择上,研究相似度匹配的度量问题。而在国外是基于颜色分割研究全局匹配问题。立体匹配算法根据视差的不同计算方法分为局部立体匹配算法和全局匹配算法。前者根据像素点及周围支撑窗口的信息来计算视差值,而后者则需要构建一个全局的能量函数来进行视差值的计算。由于全局立体匹配算法的实时性比局部立体匹配算法弱,其处理速度与效率低,所以在实际应用中选择局部立体匹配算法的情况更多。由于技术的进一步发展,两种算法相互融合,互相借鉴,它们之间结合得越来越紧密,界限越来越模糊。前文中已提到,立体匹配方法还可分为基于区域、基于特征与基于相位的方法[3],这是根据匹配基元的不同。基于区域的方法中,匹配基元是一定尺寸的模板窗口,测量视差范围内窗口的相似性来实现匹配。基于特征的方法则是基于全局优化的图像特性集,通过待测图像特征集的相似性来实现匹配。基于相位的方法中匹配基元是所测图像的相位,根据空间频率的分析方法来检测待测图像不同频段的信息,进而完成立体匹配。在这上述三种方法中,基于区域的方法实现难度最低,而且无需预处理,得到的是稠密视差图,缺点则为计算耗时,对灰度变化很敏感。其他两种方法实现难度高且错误多,就可行性而言,基于区域的方法最好,故而实际情况中应用最多。论文网
虽然这项技术一直在发展,但是问题却一直存在。立体匹配中如何克服匹配的准确性与噪声的干扰,以及如何解决图像中存在的严重几何畸变与灰度失真与遮挡物等问题[4]。同时,如何建立更有效的立体模型来充分反应物理的特征信息也是需要解决的棘手问题。这一切的一切需要更加深入的研究。 立体视觉技术国内外研究现状:http://www.751com.cn/yanjiu/lunwen_20489.html