计算机系统应用教程网站

网站首页 > 技术文章 正文

YOLOv3网络在车标检测中的应用 yolo 车辆

btikc 2024-10-19 03:17:02 技术文章 7 ℃ 0 评论

近年来,随着人工智能技术的不断发展,其被广泛用于公共安全、教育、人机交互等领域,例如:人脸检测[1]、图像分类[2]、图像分割等。同样的车标检测技术对于完善智能交通具有重要作用,能够辅助实现车辆信息的确认。21世纪以来,随着国民经济快速发展,汽车数量在我国的增长速度越来越快。汽车数量过多带来交通压力的同时也会带来其他问题:套牌车、假车牌事件频频发生。这些事件的发生意味着仅仅通过车牌来确认车辆准确信息将受到阻碍。同车牌一样,车标也是车辆的一个重要属性,在结合车牌信息后,就能更准确地确认车辆信息。国内外学者对车标检测采用了不同的方法进行研究。一般而言,分为传统机器学习方法和卷积神经网络方法。

采用传统机器学习方法在进行车标检测时繁琐,需要分为两个独立的步骤:首先进行车标定位,然后进行车标识别。文献[3]-[4]采用传统机器学习方法在进行车标定位和识别过程中都需要由专业人员人工设计特定特征,但是这些特征对于光照、阴影、车身倾斜等的变化所表现出来的鲁棒性不强,在应用于实际场景下会出现低检测率和识别率问题。针对传统机器学习方法的不足,卷积神经网络方法应运而生。

早在20世纪80年代末期,卷积神经网络[5]技术就已经应用于视觉任务中,但由于当时设备的运算能力不强和数据资源的不足,这一技术并没有得到研究人员的广泛研究和长足的发展。后来得益于GPU(Graphics Processing Unit)强大的计算能力和互联网上丰富的数据资源,卷积神经网络技术得到了进一步的发展,而且也取得了突破性的进展。卷积神经网络一般包含卷积层、池化层、全连接层等。借助于卷积神经网络的强表达能力,不需要人工设计特征,在网络学习车标特征后就能自动进行车标的定位以及分类。2014年,GIRSHICK R等[6]人第一次将卷积神经网络应用于目标检测上并且获得了比只使用方向梯度直方图[7](Histogram of Oriented Gradient,HOG)特征更高的准确率,该网络称为区域卷积神经网络(Region Convlutional Network,R-CNN)。但该网络存在耗时久的弊端,伴随着对该网络框架的不断改进,其目标检测的精度不断提高,运行时间也不断减少。2015年,HE K[8]等人通过改进R-CNN网络缩短其检测时间,但其最大帧率也只能达到5FPS。这对于帧率最小为25FPS的监控视频来说是远远不够的。为了在准确率和时间上得到均衡,YOLO网络[9]得到了应用,它将物体检测作为回归问题来求解,在输入图像后经过一次前馈就能得到图像中所有待检测物体的位置和其所属的类别以及相应的置信度,进行目标检测时耗时少。

目前采用卷积神经网络进行车标检测时遇到两个问题:(1)公开的车标数据集少且包含的车标种类少[10];(2)采用卷积神经网络方法时参数多,运行耗时。因此,本文提出的采用改进的YOLOv3[11]网络进行车标检测主要有以下两个贡献:(1)替换YOLOv3中的Darknet-53为层数少的Darknet-19[12]结构,减少运算量进而减少车标检测时间;(2)构建了一个包含46类车标的数据集。

作者信息:

王 林,黄三丽

(西安理工大学 自动化与信息工程学院,陕西 西安710048)

本文暂时没有评论,来添加一个吧(●'◡'●)

欢迎 发表评论:

最近发表
标签列表