网站首页 > 技术文章 正文
鱼羊 发自 凹非寺
量子位 报道 | 公众号 QbitAI
一个新的图像分割model zoo来啦!
一大波基于PyTorch的图像分割模型整理好了就等你来用~
这个新集合由俄罗斯的程序员小哥Pavel Yakubovskiy一手打造,包含四种模型架构和30种预训练骨干模型(backbone),官方文档列举了四条主要特点:
- 高级API(两行代码构建神经网络)
- 4种模型架构:Unet,Linknet,FPN,PSPNet
- 每个架构有30种可用的编码器
- 所有编码器都具有预先训练的权重,可实现更快、更好的收敛
授人以鱼不如授人以渔,放出了model zoo还不算,小哥还贴心地提供了如何使用CamVid数据集进行训练的示例。
效果怎么样
CamVid数据集是计算机视觉领域常用的一个数据集,通常用来进行街景分割。
俄罗斯小哥用这个数据集训练了一个能识别出图片中汽车的新模型。无论这辆车是隐藏在暗夜之中还是只有黄豆大小,都逃不出图像分割模型的手掌心。
构建模型时他选择了传奇的Unet架构,并使用了se_resnext50_32x4d这个预训练骨干模型。
听上去好像很厉害的样子,但群众都相信眼见为实,不看看模型训练效果如何,心里难免有一丢丢怀疑。
嗯,看来不管是昏天黑地还是目标只有一丁点大,新模型的预测结果都挺不错。
再加大难度呢?
量子位表示眼已瞎,模型是真强。
Pavel Yakubovskiy小哥还在Colab上放了用Catalyst(PyTorch上的高级框架)训练模型的代码,感兴趣的话可以直接在浏览器上跑一下。
入园指南
model zoo已开源,免票入场,快来围观。
先来了解一下都有哪些预训练模型可以用:
以及它们的权重:
pip一下:
$ pip install segmentation-models-pytorch
$ pip install git+https://github.com/qubvel/segmentation_models.pytorch
python库安装完成,就可以轻松地创建模型啦:
1import segmentation_models_pytorch as smp 2model = smp.Unet()
根据训练任务的不同,可以通过调整骨干模型来改变网络结构,并且使用预训练权重来进行初始化:
1model = smp.Unet('resnet34', encoder_weights='imagenet')
也可以改变模型的输出类型:
1model = smp.Unet('resnet34', classes=3, activation='softmax')
所有的模型都有预训练编码器,因此准备数据的方法必须与进行权重训练时一致:
1from segmentation_models_pytorch.encoders import get_preprocessing_fn 2preprocess_input = get_preprocessing_fn(‘renset18’, pretrained=’imagenet’)
One More Thing
其实Pavel Yakubovskiy小哥早在去年就发布了一个基于Keras的图像分割model zoo,一经推出就颇受欢迎。
一样的配方,一样的味道,简单易用,一脉相承。麻麻再也不用担心我找不到合适的预训练模型。
不过基于Keras的版本预训练模型要少一些,小哥也没有放出对应的示例,效果如何,就需要自己去检验啦~
传送门
PyTorch版Github地址:
https://github.com/qubvel/segmentation_models.pytorch
Keras版Github地址:
https://github.com/qubvel/segmentation_models
Colab上手:
https://colab.research.google.com/gist/Scitator/e3fd90eec05162e16b476de832500576/cars-segmentation-camvid.ipynb#scrollTo=A40deTWg-WJ1
— 完 —
诚挚招聘
量子位正在招募编辑/记者,工作地点在北京中关村。期待有才气、有热情的同学加入我们!相关细节,请在量子位公众号(QbitAI)对话界面,回复“招聘”两个字。
量子位 QbitAI · 头条号签约作者
?'?' ? 追踪AI技术和产品新动态
猜你喜欢
- 2024-10-03 基于深度学习的行人重识别研究综述(下)
- 2024-10-03 智能板材数量检测系统,遥遥领先!
- 2024-10-03 多尺度特征融合:为检测学习更好的语义信息(附论文下载)
- 2024-10-03 基于PyTorch的CV模型框架,北大学生出品TorchCV
- 2024-10-03 UAV新潮,RGB-D相机助力UAV语义分割
- 2024-10-03 最新计算机视觉学习路线 计算机视觉专业课程
你 发表评论:
欢迎- 最近发表
- 标签列表
-
- oraclesql优化 (66)
- 类的加载机制 (75)
- feignclient (62)
- 一致性hash算法 (71)
- dockfile (66)
- 锁机制 (57)
- javaresponse (60)
- 查看hive版本 (59)
- phpworkerman (57)
- spark算子 (58)
- vue双向绑定的原理 (68)
- springbootget请求 (58)
- docker网络三种模式 (67)
- spring控制反转 (71)
- data:image/jpeg (69)
- base64 (69)
- java分页 (64)
- kibanadocker (60)
- qabstracttablemodel (62)
- java生成pdf文件 (69)
- deletelater (62)
- com.aspose.words (58)
- android.mk (62)
- qopengl (73)
- epoch_millis (61)
本文暂时没有评论,来添加一个吧(●'◡'●)