网站首页 > 技术文章 正文
今天介绍一个快速定位人脸的深度学习算法MTCNN,全称是:Multi-task Cascaded Convolutional Networks多任务级联卷机网。这个快速定位的深度学习有3个很好的作用。
1.可以构建除人脸外其他快速定位的应用。
2.可以在定位人脸后,提高后面对人脸识别的速度。
3.分步骤级联算法,可以尝试提高每层算法的优化,给出一个优化算法的可行方案。
本案就是利用MTCNN构建3个卷积网逐层处理,最终确定人脸个数,人脸的具体位置和五官位置!
上图简析了程序的3个步骤。
stage1: 在构建图像金字塔的基础上,通过全卷机网检测人脸个数和大致区域,同时利用boundingbox regression (边框回归)和 NMS(非极大值抑制(Non-Maximum Suppression)来进行修正。(注意:这里的全卷积网络与R-CNN里面带反卷积的网络是不一样的,这里只是指只有卷积层,可以接受任意尺寸的输入,靠网络stride来自动完成滑窗)
stage2: 将通过stage1的所有窗口输入作进一步判断,同时也要做boundingbox regression 和 NMS。
stage3: 和stage2相似,只不过增加了更强的约束:5个人脸关键点。
程序对应的 create_mtcnn建立了这3个全卷积层。
以上程序构成的全卷积网络的概览
以上3图详解了3个全卷积层的尺寸构成。逐层细化,以此来加快速度是一个基本思路。
程序结合opcv对图像进行实时采集和处理显示。最终结果
下一篇文章我们讲讲这里面用到的boundingbox regression (边框回归)和 NMS(非极大值抑制(Non-Maximum Suppression)算法。
需要代码可以点击左下角的了解跟多,可以从我们网站上下载源码。另外关注我们,有更多可以实际运行的深度学习案例。
昂钛客ai专注人工智能社群,做最真实的人工智能!请关注我们、留言、点赞!
请关注
猜你喜欢
- 2024-10-02 ECCV 2018 目标检测 | IoU-Net:将IoU的作用发挥到极致
- 2024-10-02 10行python机器学习卷积网,如何实时100人脸定位?!普通电脑运行
- 2024-10-02 深度学习——IoU、GIoU、DIoU、CIoU损失函数的那点事儿
- 2024-10-02 IoU、GIoU、DIoU、CIoU损失函数的那点事儿
- 2024-10-02 目标检测中的预测框回归优化之IOU、GIOU、DIOU、CIOU和EIOU
- 2024-10-02 深度学习图像目标检测必须掌握的基本概念与知识
- 2024-10-02 人工智能与深度学习OpenCV对象检测:Faster-RCNN模型图片识别
- 2024-10-02 AAAI 2020 | DIoU损失函数详解,源码已开源
- 2024-10-02 CV面试夺命三连问:什么是NMS ? 与Soft-NMS的区别? 编程实现?
你 发表评论:
欢迎- 最近发表
- 标签列表
-
- oraclesql优化 (66)
- 类的加载机制 (75)
- feignclient (62)
- 一致性hash算法 (71)
- dockfile (66)
- 锁机制 (57)
- javaresponse (60)
- 查看hive版本 (59)
- phpworkerman (57)
- spark算子 (58)
- vue双向绑定的原理 (68)
- springbootget请求 (58)
- docker网络三种模式 (67)
- spring控制反转 (71)
- data:image/jpeg (69)
- base64 (69)
- java分页 (64)
- kibanadocker (60)
- qabstracttablemodel (62)
- java生成pdf文件 (69)
- deletelater (62)
- com.aspose.words (58)
- android.mk (62)
- qopengl (73)
- epoch_millis (61)
本文暂时没有评论,来添加一个吧(●'◡'●)