计算机系统应用教程网站

网站首页 > 技术文章正文

「人脸检测系列」mtcnn 算法中的偏移量分析

btikc 2024-09-20 14:31:23 技术文章 20 ℃ 0 评论

最近小编在后台收到一名同学的留言，她问“在前向推理过程中，mtcnn中的偏移量是如何用到的，我想对于初学者而言，也仅能跑跑代码，看一下效果，但对于一些原理性的东西，理解的不是很透彻，今天，小编就带大家来看一下，mtcnn中的偏移量是如何使用的。

首先看一下mtcnn中的偏移量。还要从训练数据的准备开始，这里我截取了github上start比较多的项目来看的（项目地址：https://github.com/Seanlinx/mtcnn，欢迎star）。

这里x1,y1,x2,y2（人脸左上角和右下角的坐标）为图像中人脸的真实位置，nx1,nx2,nx3,nx4为根据 x1,y1,x2,y2生成的随机坐标（目的为扩大数据集），nx1,nx2,nx3,nx4与x1,x2,x3,x4的对应关系为：

 offset_x1 = (x1 - nx1) / (x2 - x1)
 offset_y1 = (y1 - ny1) / (y2 - y1)
 offset_x2 = (x2 - nx2) / (x2 - x1)
 offset_y2 = (y2 - ny2) / (y2 - y1)

那么我们可以得出

x1 = offset_x1 * (nx2 - nx1) + nx1
y1 = offset_y1 * (ny2 - ny1) + ny1
x2 = offset_x2 * (nx2 - nx1) + nx2
y2 = offset_y2 * (ny2 - ny1) + ny2

其中这里的 nx1，nx2,ny1,ny2为推理过程中获取的坐标。

猜你喜欢

2024-09-20 总结一下字节跳动那些变态的算法面试题
2024-09-20 基于深度学习的人脸检测与识别系统
2024-09-20 通用创新点:坐标注意力机制!低成本下表现依旧SOTA
2024-09-20 盘点阿里那内部的那些“潜规则”
2024-09-20 阿里内部真的很乱吗?同级真的没有友情可言吗?
2024-09-20 AAAI 2023 Oral | 图像质量堪忧干扰视觉识别，达摩院提出更鲁棒框架
2024-09-20 资源|这套网红教程，带你系统学习深度学习
2024-09-20 大型人脸识别翻车现场
2024-09-20 暗中观察，没有「头环」:AI摄像头就可以看出你上课是否走神
2024-09-20 历久弥新的 C++ ，最近又火了这些国产开源项目

本文暂时没有评论，来添加一个吧(●'◡'●)

取消回复欢迎你发表评论:

最近发表