计算机系统应用教程网站

网站首页 > 技术文章 正文

本文重点 在物体识别领域最常用的算法有RCNN算法

btikc 2024-08-31 17:17:11 技术文章 12 ℃ 0 评论

本文重点

在物体识别领域最常用的算法有RCNN算法,但是RCNN算法有些慢,然后又有了基于RCNN的Fast-RCNN,然后又进行了演变,变为了Faster-RCNN,本文将对这三个物体识别的算法进行简单的介绍。

什么是物体识别

给定一张图片,识别出这张图片中所有的物体的类别和定位,我们可以思考一下这是一个什么问题?

如果把它看成是一个回归问题,那么我们可以这样做

本土中共有4个对象,那么我们需要对每个对象都学习出(x,y,w,h),但是有的图片不知有一个对象,如图所示:

那么这样如果把它看成回归问题,我们根本不知道有多少个对象,所以我们把他们看成是分类问题,分类问题是这样做的,我们对一张图片画很多的框,然后判断这个框中是否有对象,如果有对象是什么对象,并且画出位置。这样看起来是可以解决问题的,但是我们我们要放很多的框(不同大小),才能保证每个对象都被框上。

如图所示,我们要放置很多不同的框框才可以,那究竟要放多少个?这个我们不知道,为了解决这个问题,我们可以使用选择性搜索

我们可以使用聚类算法先将图片中的比较相近的聚在一起,然后将聚类之后颜色相近的再次合在一起,然后我们可以在画出一些框框完全包含最终的聚类结果,然后这些框框就是最终我们需要处理的框框的数量,这样的话框框的数量就可以自己学习到了。

RCNN的进化

RCNN先将这些候选框框,resize就是调整一般大,然后放到卷积神经网络中提取特征,然后用提取的特征干两件事,一件是图片分类,一件是目标定位。

但是此时的RCNN会有一些问题,这个问题就是很慢,因为要将每一个框框逐步的放到卷积神经网络中,这里很慢的,我们可以结合前面章节介绍的分类的算法,使用卷积直接在图片上进行卷积操作

这样有多少框框我们也不管了,我们可以使用卷积直接在图片进行卷积,在如图所示的conv5图中我们可以看到此时的提取的目标我们将其切割出来,放到了全连接层,进行了分类和目标定位操作。如果我们将这块也使用神经网络解决,那么就又可以提高速度了

Faster R-CNN就是这样做的,事实证明,效果很好

总结

以上就是速度对比,这里主要是简单的介绍了一下,并没有详细介绍,有兴趣的,可以关注相应的论文。

本文暂时没有评论,来添加一个吧(●'◡'●)

欢迎 发表评论:

最近发表
标签列表