人工智能深度学习:目标检测SSD算法

btikc 2024-08-30 13:02:41 技术文章 32 ℃ 0 评论

论文地址: https://arxiv.org/pdf/1512.02325.pdf

SSD(英文：Single Shot MultiBox Detector)算法属于one stage方法，2016年由Wei Liu提出。使用神经网络（VGG-16）提取feature map后进行分类和回归来检测目标物体。

特点

使用vgg-16作为主干模型，修改VGG全连接层fc6转换成3*3卷积层conv6，fc7改成1*1卷积层conv7，同时将池化层pool5由原来的stride=2的 2*2 变成stride=1的3*3。另增加4个卷积层。Conv4_3层为第一个特征图检测模块。后面新增卷积层依次为:Conv8_2，Conv9_2，Conv10_2，Conv11_2。各自大小如上图。
特征图上设置检验框主要考虑：尺度（大小）和长宽比。检验框会扫过特征图的每个点，生成相应的检验框。参数生成方式见上图。
训练过程，先确定图片中的ground truth（真实目标）与检验框是否匹配，根据iou过滤出最优先验框，保证正负样本比例接近1：3。
损失函数：损失函数主要为：位置误差和置信度误差的加权。
数据增强：主要通过水平翻转、随机裁剪颜色扭曲和随机采集块区域。
预测过程中会保留置信度高的top-k个预测框，然后使用nms算法过滤重叠较大的预测款，最后剩余的预测款即为结果。