1.2 图像分析技术
在当今这个信息化社会,人们已经越来越注意信息的处理和运用。对于得到的图像分析然后得到信息,是信息时代必不可少的环节。图像分析的方法就是从图象的底层特征以及上层结构中提取具有智能性的某些信息,其分析过程是基于综合了图像处理的技术的数学模型[1]。图像分析和关于人的视觉的研究分析也有着密不可分的关系,为了提高计算机视觉能力,就需要对于人的视觉机制中的有些可辨识模块进行非常深入的分析研究。生活中,人们所看到的一切连续活动的场景,实际上,就是一系列连续变化的模拟图像组成的,而对于图像的分析,其实质就是关注这些图像中的运动目标。因此,对于运动物体的研究方向也就慢慢衍生为检测、分析视频的序列图像中的运动物体[2]。在数字图像处理技术和计算机视觉技术中,基于序列图像形成的视频图像的运动物体的分析研究是最为复杂的一个方向。其研究方向的实质是:针对于连续图像中,一帧帧图像的差分比较,提取出不同的部分,根据图像的分割技术,就可以提取出每帧图像的不同部分,即移动的物体,同时根据数学算法和函数就可以针对于运动目标进行识别和跟踪。综上所述,以数字图像处理为基础,从而来分析视频图像的运动的整个处理过程,涉及到了诸多的不同方面的邻域和科学。分析的整个工程是个庞大的流程:首先,采集视频信号;接着,处理采集到的图像信号;然后,根据不同的具体应用状况和需求,研发人员才能够编写相应的程序进行个性化的研发。在进行整个项目的建立,编写,修正的过程中,对于每个工程人员,假设从最低层的算法代码以及图像的处理代码开始编写程序,无疑会造成极大的浪费,而且同时也很难保证整个系统结构的稳定,通用和实用性。当然,面对分析运动物体鲁棒性、实时性的高要求下,给视频中的运动物体的分析带来很大的挑战。
图像分析一般划分为四个主要的过程:①传感设备的输入:即将实物转换为计算机能识别的表达形式,也就是将模拟信息转换症数字信息,并且将3D的物体和场景通过计算机的算法转换为2D的平面图像,从而可以进行进一步的分析和处理。②目标物体的分割:每帧图像都是由图像基元构成的,应用些有关场景汇总的目标对象的知识或者信息,就能把物体和场景分解成一种分级的构成。这种在场景中分解目标物体的分割过程是一个决策过程,其实质的算法分为像点技术以及区域技术两类。所说的像点技术就是利用阈值和像点的灰度的方法作比较去分类各个的像点;而区域技术则是基于检出边界、线条、区域等信息,借由纹理、局部地区的灰度、对比度等特征。③目标物体的识别:即,对于图像分割中提取出来的某一物体给以相应的身份。对于现有的技术,一般是根据图像的灰度信息和目标物体的轮廓分析,利用决策理论和结构的方法进行分类。④解释识别所得到的信息:建立环境中物体的分级的构造,由启发式的方法或者人机交互技术相互结合的识别方法,然后描述场景中的目标物体,以及物体和物体之间存在的关系。[3]和3D场景相似,人们认知环境是通过利用已知的场景物体信息和通过各个对象相互之间的制约关系的知识,认识了解环境的。那么在计算机视觉技术中,2D平面的图像就是利用表面轮廓线形状、灰度阴影、纹理变化等推断出三文物景的表面走向。
对于计算机视觉技术的研究,人们早已不在注重于2D的图像分析处理技术,而是渐渐开始向3D的图像技术过渡。立体3D技术,实质是利用人们两眼捕捉到的图像信息的差别以及光线投影物体的折射原理,使得人们尽管是在一个2D的平面中仍然能够直接从视觉上感受到一幅3D的立体图。图像中景物不仅能如真实场景中的,突出于画面,而且能够互相遮掩而深藏于画面之中,整个画面能够使人产生活灵活现,栩栩如生的感觉,在视觉上形成了强劲的冲击力。2D平面图像以及3D平面图像存在的根本性差别:2D的图像仅仅能反映物体之间的上下和左右的二文关系,假设,运用光影的虚实结合以及明暗的效果也能够造成使虚假性的立体感觉[4]。然而,人们所研究的真正的立体三文图像是根据模拟了人眼所看到的所感知到的视觉世界的原理,利用了光学的折射原理所创造出来的,这样所形成的3D图像可以使眼睛在感观上就能看到除了二文图像中物体的上下、左右关系,还加上了前后关系,从而形成了三文的关系,使整个画面犹如亲眼所认知到的真实,所能从图像中获得的信息也更为具体,清晰,明了。将此技术应用于计算机的视觉技术,将给计算机视觉技术和人工智能的未来发展提供一个更大的帮助。 OpenCV移动目标物体的检测跟踪的研究(3):http://www.751com.cn/jisuanji/lunwen_524.html