计算机系统应用教程网站

网站首页 > 技术文章 正文

行人重识别(Re-id)技术研究|数据堂

btikc 2024-10-08 01:19:31 技术文章 14 ℃ 0 评论

行人重识别应用于智能监控领域,旨在非重叠视角域多摄像头网络下进行的行人匹配,即确认不同位置的摄像头在不同的时刻拍摄到的行人目标是否为同一人。本文根据研究对象的不同,将目前的研究分为基于图像的行人重识别(即在每个数据集中每个摄像机视角下只有一幅或者几幅行人图像)和基于视频的行人重识别两类,对这两类分别从特征描述、度量学习(Q1)和数据库集 3 个方面将现有文献分类进行了详细地总结和分析。此外,随着近年来深度学习算法的广泛应用,也带来了行人重识别在特征描述和度量学习方面算法的变革,总结了深度学习在行人重识别中的应用,并对未来发展趋势进行了展望。行人重识别(person re-identification)是近几年智能视频分析领域兴起的一项新技术,属于在复杂视频环境下的图像处理和分析范畴,是许多监控和安防应用中的主要任务。

行人重识别意义

行人重识别是指在已有的可能来源与非重叠摄像机视域的视频序列中识别出目标行人,行人重识别的研究面临着诸如图像分辨率低、视角变化、光线变化、姿态变化以及遮挡等带来的诸多挑战。比如,

1)监控视频的画面一般比较模糊,分辨率也比较低。

2)行人重识别的图像往往采自于不同的摄像机,由于拍摄场景、摄像参数不同,行人重识别工作一般存在光照变化及视角变化等问题。

3)进行重识别的行人图像可能拍摄于不同的时间,行人姿态、衣着会有不同程度的改变。

4)实际视频监控下的场景非常复杂,很多监控场景人流量大,场景复杂,画面很容易出现遮挡等情况。


研究现状

传统的行人重识别从特征提取和距离度量学习两个方面进行研究。2014 年后,越来越多的研究者尝试将行人重识别的研究与深度学习结合在一

起,深度学习不仅应用于提取高层特征,也为度量学习的研究带来了革新。行人重识别最开始是在基于图片的情况下,从 2010 年后,很多学者开始对基于视频的行人重识别进行研究。


评价标准

在研究中为了评价所提出的行人重识别方法的性能,通常将数据库中的行人分为训练集和测试集两个部分。在测试时,第 1 个摄像机所拍摄的数据作为查找集(query),而第 2 个摄像机中的行人数据为候选集(gallery)。

目前常用的评价标准主要是 CMC 曲线 (cumu-lated matching characteristic),当查找的对象在候选集中进行距离比较之后,将候选集中的行人按照距离的远近由小到大进行排序,要查找的行人排序越靠前(可以设置一个R值,来计算查找的正确率),则算法的效果越好(CMC?值越大,准确率越高)。


基于图像的行人重识别研究(传统+深度)

属于图片检索,行人重识别算法大致可分为基于特征描述的方法和基于距离度量学习的方法两类。基于特征描述的方法关注的是找到较好的描述行人外貌特征的表观模型(Q2),基于度量学习的方法关注的是找到有效的行人特征相似度的度量准则(Q3)(能不能类比生成模型和判决模型?)。


度量学习方法

由于干扰,不同摄像头间可能会失去连续的位置和运动信息,使用欧氏距离、巴氏距离等标准的距离度量来度量行人表观特征的相似度不能获得很好的重识别效果。因此,研究者们提出通过度量学习的方法。该方法获得一个新的距离度量空间,使得同一行人不同图像的特征距离小于与不同人的距离。距离度量学习方法一般是基于马氏距离(Mahalanobis distance)(Q7)而进行。训练得到一个马氏矩阵,通过这样学习到的距离尺度变换,使得相同的人的特征距离减小,而不同的人特征距离增大,以此开创了行人重识别中距离度量学习的先河。


数据集

数据堂自制版权的系列数据集产品为“Re-ID”这一技术路径的实现提供了强有力的支持。

10,000人监控场景下Re-ID数据

该数据包括室内场景和室外场景。数据涵盖男性女性,年龄分布为儿童至老人。数据多样性包括不同年龄段、不同时间段、不同拍摄角度、不同人体朝向和姿态、不同季节服饰。在标注方面,标注人体矩形框和15种人体属性信息。10,000人监控场景下Re-ID数据可用于Re-ID等任务。


为了更好地结合 CNN、RNN 等方法,在今后的发展中大规模的数据集将会成为研究者的研究重点,另外更多的有实际研究价值的大规模数据集会被提出,适应研究发展的需要。在新技术的应用方面还非常不足。虽然引入了深度学习进行特征提取或分类,但多集中于深度判别式学习,而很少用到深度生成式模型(生成式模型的目的是找到一个函数可以最大的近似数据的真实分布-概率密度函数)。

Tags:

本文暂时没有评论,来添加一个吧(●'◡'●)

欢迎 发表评论:

最近发表
标签列表