计算机系统应用教程网站

网站首页 > 技术文章 正文

技术论文|基于 Transformer 改进的 Faster-Rcnn 仓储箱体检测算法

btikc 2024-09-14 00:48:07 技术文章 54 ℃ 0 评论


欢迎引用

DOI:10. 14016 / j. cnki. 1001-9227. 2022. 08. 001



作者:李映松,杨爱英,刘轩,畅宇堃

( 北京理工大学光电学院 )


摘 要 :为解决传统目标检测方法准确性差、效率低 ,无法满足智能仓储场景需求的问题 ,提出基于 Transformer 改进的Faster-Rcnn 仓储箱体检测模型 。首先 ,在 Faster-Rcnn 模型的基础上 ,将卷积神经网络 Resnet50 改进为 Swin Transformer 模型 ,使用 Swin Transformer 进行全局信息提取 ,解决了使用传统算法特征提取不理想 ,产生冗余的检测窗 口以及误检窗口的问题 。其次 ,引入了特征金字塔结构 ,使模型适用于多尺度的物体检测 。最后 ,使用 ROI Align 代 替 ROI Pooling,消除了 ROI Pooling 中因浮点数取整从而对后层的检测框回归产生的误差 。在 自建的仓储数据集训 练模型 ,将数据集图片进行随机旋转、随机剪裁、图片标准化等操作进行数据增强 。实验结果表明 ,改进后的模型用 于箱体检测 ,平均准确率达到 90. 6% ,平均召回率达到 93. 3% ,平均检测速度达到 8. 9fps,较好地实现了仓储物体的 准确检测 ,满足智能仓储的需求 。准确率方面比 Faster R-CNN、YOLOv3、SSD、FCOS 等算法高出 6. 1%、5%、10. 2%、 9. 7% ,召回率高出了 5. 9%、4%、10. 1%、9. 4%。


关键词 : 目标检测;仓储场景;Faster RCNN 模型;Swin Transformer 模型




(来源: 自动化与仪器仪表 2022年第8期)

关注我的你,是最香哒!

本文暂时没有评论,来添加一个吧(●'◡'●)

欢迎 发表评论:

最近发表
标签列表