计算机系统应用教程网站

网站首页 > 技术文章 正文

基于卷积化Transformer的行人重识别算法研究

btikc 2024-10-08 01:19:44 技术文章 13 ℃ 0 评论

论文信息

题目:Learning convolutional multi-level transformers for image-based person re-identification

作者:Peilei Yan, Xuehu Liu, Pingping Zhang & Huchuan Lu

引用格式:Yan, P., Liu, X., Zhang, P., et al. Learning convolutional multi-level transformers for image-based person re-identification (2023). Visual Intelligence 1, Article no. 24.

全文链接:https://doi.org/10.1007/s44267-023-00025-8

关键词:Person re-identification, Vision transformer, Global-local features, Deeply-supervised learning

文章摘要

行人重识别是计算机视觉中一个重要的研究课题。由于行人的外观多变和背景复杂等问题,实现高效的重识别仍面临着诸多挑战。众所周知,卷积神经网络可以通过卷积操作提取行人精细的局部特征,Transformer可以通过自注意力层构建行人局部特征的全局关联。基于此,本文结合卷积神经网络和Transformer网络各自的优势,将渐进式特征分块学习的思想融入到Transformer中,最终融合图像全局特征与局部特征以实现精准的行人重识别。具体地,首先本文提出了一个尺度感知模块,即使用卷积网络提取多尺度的图像特征。然后,本文设计了一个分块感知Transformer编码器,利用粗粒度分块特征的全局信息,指导细粒度分块特征的编码学习。最后,利用深度监督学习损失以提高模型的训练效率。在四个公开的大规模数据集上的实验结果表明,本文提出的方法可以取得更优异的行人重识别性能。

详情链接:https://mp.weixin.qq.com/s?__biz=MzUxMDE4MzAzOA==&mid=2247725850&idx=2&sn=ca5ded8d1be9273c823f9b8780059dff&chksm=f90be00bce7c691df361ed4300e5e0cc14677d153edb7fec1aae1c84e05ca029e0b5a30e2ede&token=389498866&lang=zh_CN#rd

Tags:

本文暂时没有评论,来添加一个吧(●'◡'●)

欢迎 发表评论:

最近发表
标签列表