微信公众号 : 计算机视觉研究院
转自《机器之心》
本文将分 3 期进行连载,共介绍 16 个在目标检测任务上曾取得 SOTA 的经典模型。
第 1 期:R-CNN、SPP-Net、Fast R-CNN、Faster R-CNN、OHEM
第 2 期:R-FCN、Mask RCNN、YoLo、SSD、FPN、RetinaNet
第 3 期:RRC detection、CornerNet、M2Det、FOCS、ObjectBox
您正在阅读的是其中的第 1 期。前往 SOTA!模型资源站(sota.jiqizhixin.com)即可获取本文中包含的模型实现代码、预训练模型及 API 等资源。
模型 | SOTA!模型资源站收录情况 | 模型来源论文 |
---|---|---|
R-CNN | https://sota.jiqizhixin.com/project/r-cnn-2 收录实现数量:2 支持框架:MindSpore | Rich feature hierarchies for accurate object detection and semantic segmentation |
SPP-Net | https://sota.jiqizhixin.com/project/sppnet 收录实现数量:3 支持框架:PyTorch,MindSpore等 | Spatial Pyramid Pooling in Deep Convolutional Networks for Visual Recognition |
Fast R-CNN | https://sota.jiqizhixin.com/project/fast-rcnn-2 收录实现数量:27 支持框架:PyTorch,TensorFlow等 | Fast R-CNN |
Faster R-CNN | https://sota.jiqizhixin.com/project/faster-r-cnn-2 收录实现数量:16 支持框架:PyTorch,TensorFlow等 | Faster R-CNN: Towards Real-Time Object Detection with Region Proposal Networks |
OHEM | https://sota.jiqizhixin.com/project/ohem 收录实现数量:5 支持框架:PyTorch,TensorFlow | Training Region-based Object Detectors with Online Hard Example Mining |
本文回顾目标检测中必备的TOP模型,包括one-stage模型和two-stage模型。
一、two-stage模型
图1. R-CNN目标检测系统概览
图2. 一个带有空间金字塔池层的网络结构。这里256是conv5层的过滤器编号,conv5是最后一个卷积层
图3. Fast R-CNN架构。将一个输入图像和多个感兴趣的区域(RoI)输入到一个全卷积网络。每个ROI汇集成一个固定大小的特征图,然后通过全连接层(FCs)映射成一个特征向量。该网络对每个RoI有两个输出向量:softmax概率和每类bounding box回归偏移。该架构采用多任务损失法进行端到端训练
图4. RPN结构
图5. Faster R-CNN是一个用于物体检测的单一、统一的网络。RPN模块作为这个统一网络的 "注意力"
图6. OHEM训练过程,给定一个图像和选择性搜索的RoI,conv网络计算出一个conv特征图。在(a)中,只读RoI网络对特征图和所有RoI(绿色箭头所示)进行前向传递。然后,Hard RoI模块使用这些RoI损失来选择B个样本。在(b)中,这些hard样本被RoI网络用来计算前向和后向传递(红色箭头所示)
转载请联系本公众号获得授权
计算机视觉研究院学习群等你加入!
计算机视觉研究院
公众号ID|ComputerVisionGzq
??
本文暂时没有评论,来添加一个吧(●'◡'●)