计算机系统应用教程网站

网站首页 > 技术文章 正文

自动化所目标跟踪论文整理!三篇综述、两篇ICCV 2019

btikc 2024-08-29 12:08:25 技术文章 13 ℃ 0 评论

关注微信公众号:人工智能前沿讲习

对话框回复“paper61”获取论文打包下载地址


目标跟踪一直是计算机视觉领域的研究热点,中科院自动化所整理了一些供同学参考学习的Paper,包括3篇综述和2篇入选ICCV 2019的论文。


一、单目标跟踪综述

Deep Learning for Visual Tracking: A Comprehensive Survey

Mojtaba Marvasti,Zadeh Seyed,Cheng Li,Ghanei,Yakhdan Hossein,Kasaei Shohreh

视觉目标跟踪是计算机视觉领域中最热门但最具挑战性的研究主题之一。目前已经建立了许多大规模的基准数据集,并在此基础上开发了许多方法,并证明了这些方法在近年来取得了重大进展-。这项研究旨在系统地调查当前基于DL的视觉跟踪方法,基准数据集和评估指标。它广泛评估和分析了领先的视觉跟踪方法。首先,从以下六个关键方面总结了基于DL的方法的基本特征,主要动机和贡献:网络架构,网络开发,网络培训,用于视觉跟踪,网络目标,网络输出以及利用相关过滤器的优势。其次,比较了流行的视觉跟踪基准及其各自的属性,并总结了它们的评估指标。第三,在OTB2013,OTB2015,VOT2018和LaSOT等一系列公认的基准上,对基于DL的最新方法进行了全面检测。最后,通过对这些最新方法进行定量和定性的批判性分析,研究了它们在各种常见情况下的利弊。


二、多目标跟踪综述

Deep learning in video multi-object tracking: A survey

Gioele Ciaparrone,Francisco LuqueSánchez,Siham Tabik,Luigi Troiano,Roberto Tagliaferri,Francisco Herrera

多目标跟踪(Muti-object Tracking,MOT)的问题在于要遵循序列中不同目标(通常是视频)的轨迹。近年来,提供解决此问题的算法得益于深度模型的表示能力。本文对采用深度学习模型解决单摄像机视频中的MOT任务的作品进行了全面的调查。确定了MOT算法的四个主要步骤,并对这些阶段的每个阶段如何使用深度学习进行了深入回顾。作者还在三个MOTChallenge数据集上进行了完整的实验比较,确定了表现最好的方法之间的许多相似之处,并提出了一些可能的未来研究方向。


三、目标跟踪与目标分割综述

Video Object Segmentation and Tracking: A Survey

Rui Yao, GuoSheng Lin, ShiXiong Xia, JiAQi Zhao, and Yong Zhou

对象分割和对象跟踪是计算机视觉领域的基础研究领域。这两个主题很难处理一些常见的挑战,例如遮挡,变形,运动模糊和缩放比例变化。前者包含异类对象,交互对象,边缘模糊性和形状复杂性。后者在快速运动,视线外和实时处理方面存在困难。将视频对象分割和跟踪(Video Object Segmentation and Tracking,VOST)这两个问题结合起来可以克服它们各自的困难并提高其性能。VOST可以广泛地应用于许多实际场景,例如视频摘要,高清视频压缩,人机交互和自动驾驶。本文旨在全面介绍最新的跟踪方法,并将这些方法分为不同类别,以研究新趋势。首先,我们提供了现有的分层分类方法,包括无监督的VOS,半监督的VOS,交互式VOS,弱监督的VOS和基于分的跟踪方法。其次,我们对不同方法的技术特征进行了详细的讨论和概述。第三,我们总结了相关视频数据集的特征,并提供了多种评估指标。最后,我们选出了一组有趣的未来作品,并得出了自己的结论。以及基于细分的跟踪方法。


四、短时跟踪SOTA(ICCV 2019)

Learning Discriminative Model Prediction for Tracking

Goutam Bhat,Martin Danelljan,Luc Van Gool,Radu Timofte

源码地址:https://github.com/ visionml/pytracking

当前对端到端可训练计算机视觉系统的发展对视觉跟踪的任务提出了重大挑战。与大多数视觉问题相比,跟踪需要在推理阶段在线学习优秀的靶向目标的外观模型。为了实现端到端的训练,目标模型的在线学习因此需要嵌入到跟踪体系结构本身中。由于所施加的挑战,流行的暹罗范例仅能预测目标特征的模板,而在推理过程中忽略了背景外观信息,因此,预测模型具有有限的目标背景可分辨性。我们开发了一种端到端的跟踪体系结构,能够充分利用目标和背景外观信息进行目标模型预测。通过设计专用的优化过程(仅需几次迭代即可预测功能强大的模型),我们的体系结构源自有区别的学习损失。此外,我们的方法能够学习判别损失本身的关键方面。拟议的跟踪器在6个跟踪基准上设置了最新技术,在VOT2018上实现了EAO评分0.440,同时以超过40 FPS的速度运行。


五、长时跟踪SOTA(ICCV 2019)

Skimming-Perusal’ Tracking: A Framework for Real-Time and Robust Long-term Tracking

Yan Bin, Zhao Haojie, Wang Dong, Lu Huchuan, Yang Xiaoyun

源码地址:https://github.com/iiau-tracker/SPLT

与传统的短时跟踪相比,长时跟踪带挑战更多,并且更接近于实际应用。在这项工作中,我们基于提出的略读和细读模块提出了一种新颖的,健壮的,实时的长期跟踪框架。细读模块包括一个有效的边界框回归器(用于生成一系列候选方案)和一个健壮的目标验证程序,用于以其置信度得分推断最佳候选者。基于此分数,我们的跟踪器需要确定被跟踪对象是否存在,然后在下一帧中分别选择本地搜索或全局搜索的跟踪策略。为了加快整个图片的全局搜索,我们设计了一种新颖的筛选模块,可以从大量的滑动窗口中有效地选择最可能的区域。在VOT-2018长期基准和OxUvA长期基准上的大量实验结果表明,该方法可实现最佳性能并实时运行。

转载来源:会议之眼

本文暂时没有评论,来添加一个吧(●'◡'●)

欢迎 发表评论:

最近发表
标签列表