基于深度学习的目标检测技术的边框优化损失发展历程:Smooth L1 loss --- IoU_Loss(2016) --- GioU_Loss(2019) --- DioU_Loss(2020) --- CioU_loss(2020)
IoU_Loss:
存在的问题:
- 当预测框和目标框不相交时,IOU=0,无法反应两个框距离的远近,此时损失函数不可导,IOU_Loss无法优化两个框不相交的情况
- 当两个预测框大小相同,两个IOU也相同,IOU_Loss无法区分两者相交情况的不同
GIoU_Loss
GIoU_Loss在IoU_Loss基础上增加相交尺度的衡量方式,解决IoU优化问题
存在的问题:
状态1、2、3都是预测框在目标框内部且预测框大小一致的情况,这时预测框和目标框的差集都是相同的,因此这三种状态的GIOU值也都是相同的,这时GIOU退化成了IOU,无法区分相对位置关系。
DIoU_Loss
好的目标框回归函数应该考虑三个重要几何因素:重叠面积、中心点距离,长宽比
针对IoU和GIoU存在的问题,研究者从两方面考虑:
- 如何最小化预测框与目标框之间的归一化距离?
- 如何在预测框和目标框重叠时,回归的更准确?
针对第一个问题,提出DIoU_Loss(Distance_IoU_Loss)
DIoU_Loss考虑了重叠面积和中心点距离,当目标框包裹预测框的时候,直接度量2个框的距离,因此DIoU_Loss收敛的更快
尽管如此,DIoU_Loss未考虑到长宽比给预测框带来的影响
如图所示,当预测框和目标框中心点距离相同,按照DIoU_Loss的计算公式,三者的值都是相同的,未能有效区分差异
CioU_Loss:重叠面积、中心点距离、长宽比
因此可总结得到以下结论:
- IoU_Loss:主要考虑检测框和目标框重叠面积。
- GIoU_Loss:在IoU的基础上,解决边界框不重合时的问题。
- DIoU_Loss:在IoU和GIoU的基础上,考虑边界框中心点距离的信息。
- CIoU_Loss:在DIoU的基础上,考虑边界框宽高比的尺度信息。
本文暂时没有评论,来添加一个吧(●'◡'●)