图像识别与原理目标检测02

目标检测，物体识别是一个通用术语，描述一组相关的计算机视觉任务，涉及识别数码照片中的物体。

图像分类预测图像中一个物体的类别。对象定位是指识别图像中一个或多个物体的位置，并在其范围周围绘制大量的框。目标检测组合这两个任务，并对图像中的一个或多个对象进行本地化和分类。

当用户或从业者提到[物体识别他们通常的意思是目标检测“.

……我们将广泛使用物体识别一词，包括图像分类（需要算法来确定图像中存在哪些物体类别的任务）和物体检测（需要算法来定位图像中存在的所有物体的任务）

— 大规模视觉识别挑战, 2015.

因此，我们可以区分这三种计算机视觉任务：

图像分类预测图像中对象的类型或类别。

输入只有一个物体的图像，如照片。

输出类标签（例如映射到类标签的一个或多个整数）。

对象定位：定位图像中物体的存在，并用边界框指示它们的位置。

输入有一个或多个物体的图像，如照片。

输出：一个或多个边界框（例如由点、宽度和高度定义）。

目标检测：用边界框定位对象的存在，并在图像中定位对象的类型或类。

输入有一个或多个物体的图像，如照片。

输出：一个或多个包围盒（例如由点、宽度和高度定义），以及每个包围盒的类标签。

对计算机视觉任务分解的进一步扩展是物体分割也称为“对象实例分割”或“语义分割”，其中可识别对象的实例通过突出显示对象的特定像素而不是粗糙的边界框来表示。

从这个细分，我们可以看到，目标识别是指一套具有挑战性的计算机视觉任务。

Overview of Object Recognition Computer Vision Tasks

目标识别计算机视觉任务综述

最近在图像识别问题上的大多数创新都是作为参与ILSVRC任务的一部分。

这是一个年度学术竞赛，针对这三种问题类型中的每一种都有单独的挑战，目的是在每个层次上促进独立和单独的改进，以便更广泛地利用。例如，请参阅以下三种对应任务类型的列表，这些任务类型摘自2015年审查文件:

图像分类算法生成图像中的对象类别列表。

单目标定位：算法生成图像中的对象类别列表，以及一个轴对齐的边界框，指示每个对象类别的一个实例的位置和比例。

目标检测：算法生成图像中的对象类别列表，以及一个轴对齐的边界框，指示每个对象类别的每个实例的位置和比例。

我们可以看到单目标定位是定义更广义的[对象定位将本地化任务限制为映像中的一种类型的对象，我们可以假设这是一项更简单的任务。

下面是一个比较单个目标定位和目标检测的例子，摘自ILSVRC论文。请注意每种情况下基本真相期望的差异。

Comparison Between Single Object Localization and Object Detection

单目标定位与目标检测的比较。摘自：ImageNet大规模视觉识别挑战。

利用预测类标签的平均分类误差对图像分类模型的性能进行了评价。利用期望类的期望包围盒与预测包围盒之间的距离来评估单目标定位模型的性能。而目标识别模型的性能是利用图像中已知目标的每个最佳匹配包围盒的精度和召回率进行评估的。

网站首页 > 技术文章正文