计算机系统应用教程网站

网站首页 > 技术文章 正文

做目标检测毕设 怎么准备正负样本?

btikc 2024-10-12 10:54:14 技术文章 2 ℃ 0 评论

我目前在车厂无人驾驶部门的职责之一

便是研发无人驾驶感知领域语义|全景分割数据集 的半自动标注工具

再具体一点

计算机视觉领域的: 语义分割(Semantic Segmentation) 和 全景分割 (Panoptic Segmentation)

https://arxiv.org/pdf/1801.00868.pdf

它们或许是数据标注领域成本最高的俩个任务

具体定义可以见上图


作为计算机视觉几大任务之一

我将以标注图像分割为例

(目标检测的标注可以类比思考)

说说如何创建自己的数据集

一、标注任务

语义分割: 对图片中每一个像素标注其类别(如:汽车、行人、道路等)

全景分割:对于每一个像素,在语义分割的基础上再区分目标instance物体(如:汽车1、汽车2、行人5等)

(目标检测:对图片中感兴趣的物体,标注一个矩形和其类别,以及其他的性质)

二、标注格式

通常标注结果还是存成图片的常见格式(如: png)

图片的每一个通道存储不同信息(用数字1-255表示)

例如第一通道存储: 该像素所属类别

第二通道:如果该像素属于目标物体,他属于第几个instance

第三通道:通常是0或1,1表示该像素是可以驾驶的区域,0反之

(对于目标检测,一般保存成json的格式)

三、开源数据集

如果网上已有开源数据集

为何还要自己创建呢?

以无人驾驶领域的数据集为例

Cityscapes(戴姆勒公司、德国马普所、TU Darmstadt): https://www.cityscapes-dataset.com/

Mapillary Vistas (丰田、Lytf等赞助):https://www.mapillary.com/dataset/vistas?pKey=0_xJqX3-c-KyTb90oG_8HQ

Kitti Dataset (德国KIT和丰田芝加哥研究所): http://www.cvlibs.net/datasets/kitti/eval_scene_flow.php

等等

可以看到背后都有财团的支持


四、Github上优质标注工具

如果网上没有开源的

只有通过标注软件自己造数据集了

opencv/cvatgithub.com

abreheret/PixelAnnotationTool?github.com

fidler-lab/curve-gcn?github.com

五、结语

数据标注是如今深度学习获得巨大成功的基石 从Feifei Li创建ImageNet(1千多万张、2万多类别图片)开始 数据集便成为计算机视觉的一个热点话题 而伴随着数据集的各种challenge和刷榜单 也成为CV领域发顶会的标配 希望“无偿”使用公开数据集的研究者和业界从业者 都能尊重数据集创作者的汗水 人工智能的从业者 也能认可那些幕后做着重复枯燥标记工作者的付出 (例:贵阳数据标记村)

Tags:

本文暂时没有评论,来添加一个吧(●'◡'●)

欢迎 发表评论:

最近发表
标签列表