计算机系统应用教程网站

网站首页 > 技术文章 正文

目标检测经典论文总结(四)

btikc 2024-08-31 17:14:15 技术文章 13 ℃ 0 评论

第十一篇《DSOD: Learning Deeply Supervised Object Detectors from Scratch》

提出时间:2017年

针对问题:

本文作者认为当前的检测模型大部分都是以大数据集训练得到的分类模型为骨干网络,再将其迁移到当前数据集的检测任务上,虽然分类和检测可以共用特征,但是检测直接从头训练的模型和分类网络训练出来的模型参数还是有区别的。所以作者尝试提供一种从头有监督的训练检测网络模型的方案。

创新点:

摆脱预训练模型,从头训练自己的模型,从而摆脱结构依赖。

https://arleyzhang.github.io/articles/c0b67e9a/

第十二篇《MASK R-CNN》

提出时间:2017年

针对问题:

作者尝试从采用分割网络的思路来实现检测的任务,也就是对每个像素点判断其类别,再通过不同实例来确定其最小外接矩形框从而达到检测的目的。

创新点:

主要是ROI align技术,也就是不进行截断,而是差值方式的ROI POOLING 。

详解博客:https://blog.csdn.net/WZZ18191171661/article/details/79453780

第十三篇《Deformable Convolutional Networks》

提出时间:2017年

针对问题:

作者认为卷积神经网络由于其构建模块中的固定几何结构而固有地仅限于模型几何转换,即因为卷积核是固定的形状,无法自适应的对输入特征图上的特征进行有效的提取。所以作者设计了可变形的卷积层和池化层。

创新点:

可变形卷积,通过借鉴空洞卷积实现,通过单独的层学习采样点位置;可变形roi,roi pooling里面的每个bin都可以有一个offset来进行平移。

详解博客:https://zhuanlan.zhihu.com/p/52476083

第十四篇《YOLOv3》

提出时间:2018年

针对问题:

主要是作者对yolov2网络的持续优化和改进。

创新点:

主要是借鉴FPN和resnet来提高主干网络的特征层表征能力。

详解博客:https://blog.csdn.net/dz4543/article/details/90049377

第十五篇《Scale-Transferrable Object Detection》

提出时间:2018年

针对问题:

作者认为类似原始FPN中的特征的融合并不能够很好的增强特征的表达能力,所以设计了新的融合方式来强化这部分。

创新点:

提出了一种新的在几乎不增加参数和计算量前提下得到大尺寸featuremap的方法,首先将输入feature map在channel维度上按照r^2长度进行划分,也就是划分成C个,每个通道长度为r^2的feature map,然后将每个11r^2区域转换成rr维度作为输出feature map上rr大小的结果,最后得到rHrWC的feature map。

详解博客:https://blog.csdn.net/u014380165/article/details/80602130

第十六篇《Single-Shot Refinement Neural Network for Object Detection》

提出时间:2018年

针对问题:

作者观察到两段式网络有较好的精度表现,而一段式网络有更优秀的速度性能,作者尝试结合两者的特点来构建新的网络结构。

创新点:

TCB,ARM与ODM模块的提出。

详解博客:https://blog.csdn.net/woduitaodong2698/article/details/85258458?utm_medium=distribute.pc_relevant_right.none-task-blog-BlogCommendFromMachineLearnPai2-5.nonecase&depth_1-utm_source=distribute.pc_relevant_right.none-task-blog-BlogCommendFromMachineLearnPai2-5.nonecase

第十七篇《Relation Networks for Object Detection》

提出时间:2018年

针对问题:

大家都有感觉,物体间或者物体内一些区域的关联性是有助于目标检测任务的,但是之前没人有实际的证明如何使用这种关联性是一定可行的,本文作者就尝试在检测网络中添加注意力模块来提高网络表现。

创新点:

计算object之间的relation,作为训练参数,从而提高检测精度。

详解博客:https://blog.csdn.net/weixin_42102248/article/details/102858695

第十八篇《Cascade R-CNN: Delving into High Quality Object Detection》

提出时间:2018年

针对问题:

本文也是对网络训练过程中的优化技巧,作者发现训练检测网络时候需要设置超参数IOU阈值来判断当前定位框是否为正样本,但是一个单一的IOU阈值可能并不是合用的,所以尝试做级联的IOU阈值来辅助训练。

创新点:

为了优化RPN中的单一IOU问题对最终检测精度的影响问题而提出,做不同IOU阈值的级联来提高计算最终损失的正负样本质量及比例,从而提高性能。

详解博客:https://blog.csdn.net/qq_17272679/article/details/81260841

第十九篇《Receptive Field Block Net for Accurate and Fast Object Detection

提出时间:2018年

针对问题:

本文作者的工作也是对主干网络的不同层特征融合工作的优化进行的。主要是为了更有效且更高效的实现特征的融合。

创新点:

提出RFB结构,利用空窗卷积来进行特征的融合。

详解博客:https://blog.csdn.net/u014380165/article/details/81556769

第二十篇《Object Detection based on Region Decomposition and Assembly》

提出时间:2019年

针对问题:

本文作者还是针对两段式网络中目标框提取部分进行优化,来提高检测精度。

创新点:

思路还是借鉴之前的论文,对正样本图像块进行拆分左右上下半边和其本身,再分别送入后续卷积,目的是让网络尽可能多的看到当前正样本的丰富的特征。

详解博客:https://blog.csdn.net/c9Yv2cf9I06K2A9E/article/details/88148760

第二十一篇《M2Det: A Single-Shot Object Detector based on Multi-Level Feature Pyramid Network

提出时间:2019年

针对问题:

作者认为FPN的特征金字塔最开始就是为了分类而设计的,在检测网络中需要进行一定的适配才能达到最好的性能。

创新点:

原始的backbone更适合分类任务,改善backbone的使用机制,使其更适应检测任务。两个新模块1)TUM 通过卷积、上采样和相同shape相加来得到多尺度的特征2)FFMv2 特征融合模块,通过卷积核upsample来统一输入feature map的shape,再concat 3)SFAM 对输入的特征先concat,再进行通道层面的attention,并转化为权重参数相乘,再送入分类和回归。

详解博客:https://blog.csdn.net/hanjiangxue_wei/article/details/103311395

本文暂时没有评论,来添加一个吧(●'◡'●)

欢迎 发表评论:

最近发表
标签列表