网站首页 > 技术文章 正文
“Attention is all you need!”
这句名言又在新的领域得到了印证。
来自深圳大学和特拉维夫大学的最新成果,通过在GAN中引入注意力机制,成功解决了编辑人脸时会产生的一些“手抖”问题:
比如改变人的发型时把背景弄乱;
加胡子时影响到头发、甚至整张脸都不太像是同一个人了:
这个有了注意力机制的新模型,修改图像时清清爽爽,完全不会对目标区域之外产生任何影响。
具体怎么实现?
引入注意力图
此模型名叫FEAT (Face Editing with Attention),它是在StyleGAN生成器的基础上,引入注意力机制。
具体来说就是利用StyleGAN2的潜空间进行人脸编辑。
其映射器(Mapper)建立在之前的方法之上,通过学习潜空间的偏置(offset)来修改图像。
为了只对目标区域进行修改,FEAT在此引入了注意图 (attention map),将源潜码获得的特征与移位潜码的特征进行融合。
为了指导编辑,模型还引入了CLIP,它可以用文本学习偏移量并生成注意图。
FEAT的具体流程如下:
首先,给定一张具有n个特征的图像。如上图所示,浅蓝色代表特征,黄色部分标记通道数量。
然后在文字提示的指导下,为所有能预测相应偏置(offset)的样式代码(style code)生成映射器。
这个映射器通过潜码加偏置(wj+ Δj)修改,生成映射图像。
再接着,用注意力模块生成的attention map将原始图像和映射图像的第i层特征进行融合,生成我们要的编辑效果。
其中,注意力模块的架构如下:
左侧是用于特征提取的StyleGAN2生成器,右为用于制作注意图的Attention Network。
不修改目标区域之外的图像
在实验对比环节中,研究人员首先将FEAT与最近提出的两种基于文本的操作模型进行比较:TediGAN和StyleCLIP。
其中TediGAN将图像和文本都编码到StyleGAN潜空间中,StyleCLIP则实现了三种将CLIP与StyleGAN相结合的技术。
可以看到,FEAT实现了对面部的精确控制,没有对目标区域以外的地方产生任何影响。
而TediGAN不仅没有对发型改变成功,还把肤色变暗了(第一行最右)。
在第二组对表情的改变中,又把性别给改了(第二行最右)。
StyleCLIP整体效果比TediGAN好很多,但代价是变得凌乱的背景 (上两张图中的第三列,每张效果的背景都受到了影响)。
接着将FEAT与InterFaceGAN和StyleFlow进行比较。
其中InterfaceGAN在GAN潜空间中执行线性操作,而StyleFlow则在潜空间中提取非线性编辑路径。
结果如下:
这是一组加胡子的编辑,可以看到InterfaceGAN和StyleFlow在此操作之余对头发和眉毛做了细微改动。
除此之外,这两种方法还需要标记数据进行监督,不能像FEAT一样进行零样本操作。
在定量实验中,FEAT也展现出了它的优越性。
在五个属性的编辑结果中,FEAT比TediGAN和StyleCLIP在视觉质量(FID得分)和特征保留(CS和ED得分)方面表现更佳。
猜你喜欢
- 2024-10-15 大道至简,仅需4行代码提升多标签分类性能
- 2024-10-15 精华文稿|迈向统一的点云三维物体检测框架
- 2024-10-15 STANet简单介绍 介绍stb-1
- 2024-10-15 AAAI2022丨创新奇智提出双注意力机制少样本学习 助力工业场景细粒度识别
- 2024-10-15 首个快速知识蒸馏的视觉框架:ResNet50 80.1%精度,训练加速30%
- 2024-10-15 计算机视觉技术self-attention最新进展
- 2024-10-15 首个基于时序平移的视频迁移攻击算法,复旦大学研究入选AAAI 2022
- 2024-10-15 当Non-local遇见SENet,微软亚研提出更高效的全局上下文网络
- 2024-10-15 南洋理工发布全球首个DeepFake篡改序列检测还原数据集|ECCV 2022
- 2024-10-15 FlexAttention:解决二次复杂度,将ViT输入提升至1008 | ECCV 2024
你 发表评论:
欢迎- 最近发表
-
- 在 Spring Boot 项目中使用 activiti
- 开箱即用-activiti流程引擎(active 流程引擎)
- 在springBoot项目中整合使用activiti
- activiti中的网关是干什么的?(activiti包含网关)
- SpringBoot集成工作流Activiti(完整源码和配套文档)
- Activiti工作流介绍及使用(activiti工作流会签)
- SpringBoot集成工作流Activiti(实际项目演示)
- activiti工作流引擎(activiti工作流引擎怎么用)
- 工作流Activiti初体验及在数据库中生成的表
- Activiti工作流浅析(activiti6.0工作流引擎深度解析)
- 标签列表
-
- oraclesql优化 (66)
- 类的加载机制 (75)
- feignclient (62)
- 一致性hash算法 (71)
- dockfile (66)
- 锁机制 (57)
- javaresponse (60)
- 查看hive版本 (59)
- phpworkerman (57)
- spark算子 (58)
- vue双向绑定的原理 (68)
- springbootget请求 (58)
- docker网络三种模式 (67)
- spring控制反转 (71)
- data:image/jpeg (69)
- base64 (69)
- java分页 (64)
- kibanadocker (60)
- qabstracttablemodel (62)
- java生成pdf文件 (69)
- deletelater (62)
- com.aspose.words (58)
- android.mk (62)
- qopengl (73)
- epoch_millis (61)
本文暂时没有评论,来添加一个吧(●'◡'●)