网站首页 > 技术文章 正文
作者:Jonathan Hui
编译:ronghuaiyang
导读
YOLOv3其实之前已经有一篇文章介绍过了,不过为了系列的完整性,再将部分要点总结一下。
YOLOv3在YOLO网站上的一段话:
在Pascal Titan X上,它以30FPS的速度处理图像,在COCO test-dev上有57.9%的mAP。
类别预测
大多数分类器假设输出标签是互斥的。如果输出是互斥物体类这样是对的。因此,YOLO使用softmax函数将分数转换为总和为1的概率。YOLOv3使用多标签分类。例如,输出标签可能是“行人”和“儿童”,它们不是互斥的。(现在输出的和可以大于1)YOLOv3用独立的logistic分类器替换softmax函数,计算属于特定标签的输入的概率。YOLOv3没有使用均方误差来计算分类损失,而是对每个标签使用二进制交叉熵损失。这也通过避免了softmax函数,减少了计算的复杂性。
边界框的预测和损失函数的计算
YOLOv3使用逻辑回归预测每个边界框的物体得分。YOLOv3改变了计算损失函数的方式。如果边界框先验锚框与ground truth物体的重叠比其他物体多,则对应的objectness得分为1。对于重叠大于预定义阈值(默认0.5)的其他先验锚框,它们不会产生任何成本。每个ground truth只与一个先验锚框关联。如果一个边界框的先验锚框没有被指定,它不会出现分类和定位的损失,只会有物体的置信度的损失。我们用tx和ty(而不是bx和by)来计算损失。
像FPN一样的特征金字塔
YOLOv3对每个位置进行3次预测。每个预测一由个边界框,一个物体置信和80个类别分数组成,即N×N×[3×(4 + 1 + 80)]个预测。
YOLOv3在3个不同的尺度下进行预测(类似于FPN):
- 在最后一个feature map层上进行预测。
- 向后退2层,上采样2倍。然后YOLOv3获取一个分辨率更高的特征图,并使用元素加法将其与上采样特征映射合并。YOLOv3在合并后的映射上使用卷积进行第二组预测。
- 再重复2次,得到的feature map层具有良好的高层结构(语义)信息和良好的物体位置空间分辨率信息。
为了确定先验框,YOLOv3使用了k-means聚类。然后它预先选择9个聚类。对于COCO,锚的宽度和高度为:(10×13),(16×30),(33×23),(30×61),(62×45),(59×119),(116×90),(156×198),(373×326)。这9个先验根据其尺度分为3个不同的组。在检测物体时,每个组都被分配到上述特定一个特征图中。
特征提取器
使用新的53层Darknet-53代替Darknet-19作为特征提取器。Darknet-53主要组成包括3×3和1×1过滤器以及类似ResNet的残差网络连接。与ResNet-152相比,Darknet-53的BFLOP(十亿次浮点运算)更少,同样的分类准确率上却快了两倍。
YOLOv3 performance
YOLOv3的COCO AP指标与SSD相当,但快了3倍。但是YOLOv3的AP仍然落后于RetinaNet。特别是,AP@IoU =0.75时,与RetinaNet相比,YOLOv3的定位误差明显增加。YOLOv3在检测小对象方面也有显著的改进。
当速度很重要时,YOLOv3在快速检测器类别中表现得非常好。
英文原文:https://medium.com/@jonathan_hui/real-time-object-detection-with-yolo-yolov2-28b1b93e2088
更多文章,请关注微信公众号:AI公园
猜你喜欢
- 2024-09-24 如何学习yolo?
- 2024-09-24 计算机视觉|YOLO开源项目最强汇总
- 2024-09-24 YAD2K使用介绍
- 2024-09-24 基于yolov2深度学习网络模型的鱼眼镜头中人员检测算法
- 2024-09-24 我拿着一张贴纸就在AI面前隐身了,人工智能爆出最可笑bug
- 2024-09-24 基于yolov2深度学习网络的昆虫检测算法matlab仿真
- 2024-09-24 比Tiny YOLOv3小8倍,性能提升11个点,4MB的网络也能做目标检测
- 2024-09-24 YOLO系列的演进,从v1到v7
你 发表评论:
欢迎- 02-20利用神经网络模型检测摄像头上的可疑行为
- 02-20直击心灵:高频核心听力你了解吗?_高频听力的正常范围值是多少
- 02-20YOLOv8 POSE+XGBoost进行人体姿态检测
- 02-20100个篮球英文术语详细解释,从此听懂NBA解说
- 02-20最全紧固件中英文对照,外贸必备词典一
- 02-20带你开发一个视频动态手势识别模型
- 02-20详细介绍一下Java基础中HashMap如何进行扩容操作?
- 02-20GTX 1070 Ti显卡评测:你会购买哪一款?
- 最近发表
- 标签列表
-
- oraclesql优化 (66)
- 类的加载机制 (75)
- feignclient (62)
- 一致性hash算法 (71)
- dockfile (66)
- 锁机制 (57)
- javaresponse (60)
- 查看hive版本 (59)
- phpworkerman (57)
- spark算子 (58)
- vue双向绑定的原理 (68)
- springbootget请求 (58)
- docker网络三种模式 (67)
- spring控制反转 (71)
- data:image/jpeg (69)
- base64 (69)
- java分页 (64)
- kibanadocker (60)
- qabstracttablemodel (62)
- java生成pdf文件 (69)
- deletelater (62)
- com.aspose.words (58)
- android.mk (62)
- qopengl (73)
- epoch_millis (61)
本文暂时没有评论,来添加一个吧(●'◡'●)