网站首页 > 技术文章 正文
You Only Look Once,YOLO.
YOLO 的核心思想:利用整张图作为网络的输入,直接在输出层回归 bounding box(边界框) 的位置及其所属的类别。
yolo虽然有三个版本,由于yolo v3在性能和准确性基本上秒杀前两个版本,甚至官网都没有给出下载老版本的链接。因此,我们仅需读懂yolo v3模型结构即可。
细节:
- 卷积的本质是提取图片的特征,分类是其他层做的事情。
- 通过划分单元格做检测。
- 多尺度训练。
- 端到端训练,只使用一个loss funtion。即只关注输入和输出
- 使用激活函数:“leaky ReLU”。
- 使用batch normalization作为正则化、加速收敛和避免过拟合的方法。后文简写为BN。
- 新的基本单元DarknetConv2D_BN_Leaky,即卷积+BN+leaky ReLU(激活函数)。
- 残差单元resblock=DarknetConv2D_BN_Leaky+...+DarknetConv2D_BN_Leaky +add
- 残差单元体resblock_body。zeropadding+DarknetConv2D_BN_Leaky+resblock。
- anchors的9个参数是用聚类方式获得,格式为w_1,h_1,w_2,h_2,...w_9,h_9。
- 结构中没有池化和全连接层,使用步长为2的卷积达到图片缩小的目的。
- 输入图片尺寸固定416*416。
- 主干网络是darknet-53,共252层。
结构:
- 如下图所示,输入416*416图片。经过尺寸为3*3的32个卷积DarknetConv2D_BN_Leaky层。
- 依次经过重复单元依次为1、2、8、8、4的5个残差体(resblock_body)。
- 残差体中DarknetConv2D_BN_Leaky单元的步长为2。
- 经过残差体的2次步长为2的卷积,图片尺寸缩小为以前的1/32。
- 生成y1、y2、y3三个结果。
- 输出尺寸分别为13*13*255、26*26*255、52*52*255。
- 输出深度为255=3*(5+80),每个单元3个box,box有(x, y, w, h, confidence)五个基本参数,coco数据集的种类是80.
- 中间层和后面的某一层的上采样进行拼接。拼接的操作和残差层add的操作是不一样的,拼接会扩充张量的维度,而add只是直接相加不会导致张量维度的改变。
实现:
darknet官网
pjreddie.com/darknet/
keras实现yolo3
github.com/qqwweee/keras-yolo3
tensorflow实现yolo3
github.com/wizyoung/YOLOv3_TensorFlow
You Only Live Once.
猜你喜欢
- 2024-10-19 MindSpore:YOLOv3人体目标检测模型实现(三)
- 2024-10-19 YOLOv3网络在车标检测中的应用 yolo 车辆
- 2024-10-19 [OpenCV实战]8 深度学习目标检测网络YOLOv3的训练
- 2024-10-19 1.3MB超轻YOLO算法!全平台通用,速度快上45%丨开源
- 2024-10-19 YOLOv3目标检测算法如何应用于图片检测?
- 2024-10-19 完爆全部YOLO家族!RT-DETRv3突破目标检测网络的极限!
- 2024-10-19 AAAI 2021中的目标检测(详细版with code)
- 2024-10-19 高大上的YOLOV3对象检测算法,使用python也可轻松实现
- 2024-10-19 目标检测和识别:Python+OpenCV+Yolov3
- 2024-10-19 来自北理SlimYOLOv3无人机目标快速检测算法
你 发表评论:
欢迎- 11-18软考系统分析师知识点十六:系统实现与测试
- 11-18第16篇 软件工程(四)过程管理与测试管理
- 11-18编程|实例(分书问题)了解数据结构、算法(穷举、递归、回溯)
- 11-18算法-减治法
- 11-18笑疯了!巴基斯坦首金!没有技巧全是蛮力!解说:真远啊!笑死!
- 11-18搜索算法之深度优先、广度优先、约束条件、限界函数及相应算法
- 11-18游戏中的优化指的的是什么?
- 11-18算法-分治法
- 最近发表
- 标签列表
-
- oraclesql优化 (66)
- 类的加载机制 (75)
- feignclient (62)
- 一致性hash算法 (71)
- dockfile (66)
- 锁机制 (57)
- javaresponse (60)
- 查看hive版本 (59)
- phpworkerman (57)
- spark算子 (58)
- vue双向绑定的原理 (68)
- springbootget请求 (58)
- docker网络三种模式 (67)
- spring控制反转 (71)
- data:image/jpeg (69)
- base64 (69)
- java分页 (64)
- kibanadocker (60)
- qabstracttablemodel (62)
- java生成pdf文件 (69)
- deletelater (62)
- com.aspose.words (58)
- android.mk (62)
- qopengl (73)
- epoch_millis (61)
本文暂时没有评论,来添加一个吧(●'◡'●)