目标跟踪国内外研究现状概况

菜单

关于目标追踪的实际应用国外起步得很早。早在20世纪50年代初期，GAC公司就已经研发出了ATRAN(Automatic Terrain Recognition and Navigation(System)。美国军方等也对目标跟踪等研究非常重视。1996年到1999年期间，美国国防高级研究项目署（DARPA)建立了以CMU为首、MIT等众多高校参与的项目VSAM[2]。VSAM的目的是研究一种自动视频理解算法使得摄像机在一定的复杂度内能够自动地监测物体。虽然该算法最开始设计用来满足军事目标但是后来也能够运用于一般场景。1999年，美国马里兰大学研制出一种实时监控系统 [3],该系统能够在户外环境中检测并且监控多人行为。同时系统运用形状的组合分析能够实现定位人体以及人体的各大部分（头、手、脚、身体等），并且能够判断人是否携带物体。49131

近年来目标跟踪方面进步显著，许多优秀的跟踪算法相继被人提出，诸如如KCF算法，MeanShift算法，TLD算法，SVT算法，IVT算法，MIL算法等。Fukunage于1975年最早提出[15]Mean-Shift这个概念。然而一开始并没有因此大家的专注，直到1995年YizhongCheng发表文章重新定位了MeanShift方法[16]，这才引起了大家的广泛关注。1998年，Michael[25]等人在目标跟踪中引入了粒子滤波的思想。由于MeanShift算法的可移植性很高，所以近年来MeanShift算法经常结合在其他算法一起使用。Zhang[18]等人提出的一种高效的利用局部上下文信息的STC算法，具有良好的鲁棒性。STC跟踪算法基于贝叶斯框架，巧妙地运用快速傅里叶变换进行变换。Zdenek Kalal[22]指出适用于长期目标跟踪的算法一般存在一些问题，第一是当目标重新出现的时候，算法要能够检测出该目标，并且目标重新出现的时候它的外观可能已经发生改变。第二，长期目标跟踪算法要处理遮蔽，形变，光线变化等问题。基于这些问题Zdenek Kalal提出了一种针对长期目标跟踪的算法TLD算法[22]。Boris[26]等人指出，基于检测的跟踪算法实时速度很快，很适合应用于实时性要求较高的场景中，在实时性应用上拥有很好的前景。然而对于基于检测的跟踪算法，跟踪器稍微的不准确都会导致样本的错误分类，从而可能会进一步产生漂移等问题。因此Boris等人运用多实例学习即MIL方法代替传统的监督学习方法来避免这些问题。从而提出了了一种鲁棒性很好的MIL[26]跟踪算法。Henriques[23]等人提出论文网，大部分跟踪器的核心是一个用来区分目标和周围背景判别式的分类器，为了处理图像的自然改变，分类器通常用拓展的样本集来训练。基于这种简单的观测，Henriques等人提出了一种用来分析大量数据集的分析模型。由于数据矩阵是循环的，基于循环矩阵的特性把问题的求解变换到了离散傅里叶变换域，从而避免了矩阵求逆的过程，降低了好几个数量级的算法复杂度。Henriques等人提出了一种不同于以往的具有很好的鲁棒性的目标跟踪算法，KCF算法。Danel[23]等人指出，大多数最先进的目标跟踪算法要么依赖于亮度信息要么在图像表示中运用简单的颜色表示。在视觉追踪方面，当复杂的色彩特征结合亮度特征时不能够得到很好的表现结果，而目标识别与跟踪正好相反，两者结合能够得到良好的表现结果。由于追踪问题的复杂性，颜色特征必须能够被高效的计算，并且在维持高判别性的同时能够拥有亮度不变性。Danel等人研究了判别式跟踪框架中的颜色分布并且指出颜色分布在视觉跟踪中有更好的表现，而提出了一种自适应低维颜色属性，从而研究出一种CN跟踪算法[23]。关联滤波器很少使用在目标跟踪中，曾经也有人尝试过使用关联滤波器，然而总是不能达到很好的跟踪效果，Bolme[29]等人打破了这一局面，提出了一种新的关联滤波器MOSSE，并且基于MOSSE研究了一种新的目标跟踪算法，能达到很高的运行速度。