视频目标跟踪技术是对视频信号进行处理、分析和理解,在序列图像中找到所感兴趣的目标所处的位置,并对伺服系统进行控制,从而完成复杂的功能,典型的系统结构如图1.1所示[10]。64505
图1.1 典型视频目标跟踪系统框架
目标跟踪算法依据驱动方式可以分为:自顶向下的处理方法和自底向上的处理方法[11]。
自顶向下的处理方法是数据驱动的,其经典算法是Mean-Shift跟踪算法[12]。人们对Mean-Shift跟踪算法的研究主要集中在以下几个方面:(1)Mean-Shift跟踪算法的尺度自适应问题。(2)Mean-Shift跟踪算法的旋转自适应问题。(3)算法收敛到局部极值点的问题。(4)提高抗干扰能力以及低背景对比度下的鲁棒性。虽然研究者们从各自的角度对Mean-Shift跟踪算法进行了多种改进,但这些改进往往会对算法带来一些新的问题[13]。例如,对Mean-Shift的尺度自适应问题,SPMSA由于存在小尺度游荡和尺度跟踪滞后问题,实际上并没有彻底解决尺度自适应问题;基于特征点估计的方法和基于仿射参数估计的方法不但计算量大,而且使Mean-Shift算法丧失了跟踪非刚性目标的能力。如何解决上述问题仍然值得进一步研究[14]。论文网
自上而下的处理方法是模型驱动的,这种方法对图像分析结果的依赖性不是很强,这是因为目标假设对图像分析形成了一种强约束[15]。然而,自上而下的方法的性能却依赖于假设状态的生成以及评价方法,其经典算法是粒子滤波算法。自上而下的方法是用滤波—关联的思路处理跟踪问题,即根据序贯获得的图像观测、依据某种最优准则,递推估计目标的状态,如位置、尺度、转角等[16]。例如KF的方法、基于UKF的方法。对于自上而下的方法来讲,先验知识如何表达一直是个难题,如目标运动模型的选取方法缺乏统一的指导思想[17]。
自上而下与自下而上的方法在目标的跟踪问题上各具优缺点,将这两类算法相结合可以实现优势互补。例如,Zhaowen Wang等人提出将Camshift算法与粒子滤波的贝叶斯概率框架结合,优化粒子滤波的分布情况,改善了粒子滤波的运算复杂度[18]。Caifeng Shan等提出的方法将Mean-Shift算法嵌入到粒子滤波算法中,来提高粒子滤波的采样有效性[19]。另一些算法则通过Kalman滤波首先对运动目标的下一步动态进行预测,再在预测到的位置附近小范围内用Mean-Shift算法迭代出运动目标的位置。
本文主要针对因机载摄像机运动引起的动态运动场景进行研究,寻求复杂场景下高效准确的运动目标跟踪方法[20]。