1.2 相关技术的现状
目前的跟踪算法主要被分为两大类:产生式跟踪算法和判别式跟踪算法。产生式方法主 要是将目标的外形特征模型化,然后搜索候选目标,将重构误差最小化。常常提到的产生式 方法包括稀疏编码,在线密度估计和主成分分析等。而判别式跟踪算法又称作检测跟踪,它 依靠训练分类器,把目标和背景区分开来。近些年,基于相关滤波器的跟踪方法由于它的高 效和快速,发展得相当迅速。它的训练样本来自于输入特征的高斯回归,目标则依据后续帧 的响应峰值来定位。视觉跟踪已经被众多应用广泛研究,在本节中,我们讨论与以下工作密 切相关的:(i)相关性跟踪(correlation tracking);(ii)检测跟踪(tracking-by- detection)。
1.2.1 相关性跟踪
2010 年,Bolme 等人提出了最小均方误差和输出(MOSSE)滤波器[2],第一次将相关滤波 器应用到视觉跟踪领域。由于相关滤波器的计算效率很高,近几年在视觉跟踪领域引起了越 来越高的关注。使用相关滤波器,MOSSE 跟踪器的计算速度可以达到每秒几百帧。2012 年, Heriques 等人提出利用 CSK 方法在内核空间中使用相关滤波器[3],让速度得到了进一步提 高。CSK 方法建立在照明强度特征上,2014 年,Danelljian 等人通过将多通道特征映射到 高斯内核空间来学习自适应相关滤波器,提出了使用 HOG 特征改进的 KCF 跟踪算法[4]。同 年,Zhang 等人将上下文信息合并到滤波器学习中,并且基于连续相关响应对尺度变化进行 建模,提出了 DSST 跟踪算法[5]。
1.2.2 检测跟踪
检测跟踪目前有以下几种常用的方法:光流法、背景差法、区域匹配、主轮廓跟踪、卡 尔曼滤波等。
视觉跟踪中在线模型更新往往存在着稳定性和可塑性之间的矛盾,为了减轻这一矛盾, Kala 等人将跟踪任务分解为跟踪、学习和检测,从而提出了 TLD 算法[6]。TLD 算法中,跟 踪和检测互相促进,将来自跟踪器的结果作为训练数据以更新检测器,在检测遭遇失败时, 重新激活检测器并将之初始化。结合不同自适应速率的多个分类器,设计熵测量以融合所有 跟踪结果。Hare 等人考虑样本在搜索空间内的空间分布,提出了一个联合化结构输出Struck 算法[7]来预测对象的位置。这一设计已被证实执行效果良好。
1.3 总体技术方案及其社会影响
由于跟踪算法的性能受很多不同因素的影响,截止到现在还无法找出能够在所有场 景下完美运行的跟踪算法。同样,一个跟踪算法也需要在不同的情况下运行来衡量它的综合 性能。在面对大量被提出的跟踪方法时,我们需要一个评估基准来评估这些跟踪器的性能, 以展现其各自的优缺点,这有助于发现视觉跟踪领域当前或未来面对的困难,并为更准确高 效的跟踪算法指明研究方向。幸运的是,Wu Y[1]等人开发了一套用于评估当前最先进的跟 踪算法的标准库,以多种评价标准进行了大量的实验。最后通过定量定性分析各算法在标准 数据集上的运行结果,衡量比较一系列跟踪算法的各项综合性能。
根据 Wu Y 等人的实验结果,可以得到一些对今后目标跟踪算法具有指导意义的结论。 第一点,需要利用跟踪时得到的背景信息,这关乎到是否能够在后续帧中很好地区别目标物 体和背景。可以在判别式模型中对背景信息进行编码,这需要一种隐式的学习过程。或者直 接显式的使用背景信息,将其作为上下文信息。第二点,在动态模型上进行对后续帧上的目 标位置估计,从而大大缩小搜索范围,提升跟踪算法的性能。改进这些方面,能够进一步提 高在线目标跟踪算法的水平。