网站首页 > 技术文章 正文
DBnet文本检测网络加入多分类,可以实现模型很小又能够区分类别的功能,然后可以根据检测框的标签快速提取目标字段,在端侧部署的话就能达到非常高的精度和效率。
1.标注数据
标注方法和标注目标检测的数据一样,一个框加一个标签
pip install labelImg ==1.8.6
安装完毕后,键入命令:
labelImg
或者下载工具 labelImg.exe链接:https://pan.baidu.com/s/14iBlyr3ahhymMukeWjtTEA 提取码:c1dx
二 . 数据增强
步骤:
1.将标注数据集的标签(xml文件)放入./DataAugForObjectDetection/data/Annotations
2.将标注数据集的图片放入./DataAugForObjectDetection/data/images
3.修改./DataAugForObjectDetection/DataAugmentForObejctDetection.py/中的need_aug_num,即每张图片需要扩增的数量,然后运行./DataAugForObjectDetection/DataAugmentForObejctDetection.py
注意:DataAugmentForObejctDetection_pool.py 是多进程增强版本,耗时较少。代码中的process不宜设置过大否则可能会报错,默认即可。
三. 格式转换
将标注的数据集转换成 dbnet 训练需要用到的格式。
步骤:
1.将标注数据集的标签(xml文件)放入Annotations,图片放入images;
2.修改voc_to_coco.py的输入输出路径,并运行,然后手动分开训练集和测试集;
3.修改get_train_list.py 的输入输出路径,并运行。训练集运行一次,测试集运行一次。
四. 修改模型配置文件
修改模型配置文件 config/det_DB_resnet50_mul.yaml
修改为三.3生成的数据集文件路径
五. 开启训练
修改det_train.py 的模型配置文件路径,并运行
六. 测试
修改det_infer.py的模型路径、模型文件路径、和图片路径
项目全部代码,预训练模型获取方式:
关注微信公众号 datanlp 然后回复 db分类 即可获取。
搜索公众号添加: datanlp
长按图片,识别二维码
效果展示
dbnet不仅检测出文本行,还自动给文本行分类标签,一个框一个标签,可以按标签提取目标文本行。
猜你喜欢
- 2024-12-16 人工智能应用的模型训练和评估 人工智能模型的主要技术指标
- 2024-12-16 二年级数学计算专项练习题,检测孩子计算能力
- 2024-12-16 [图像处理] 基于CleanVision库清洗图像数据集
- 2024-12-16 python机器学习:如何储存训练好的模型并重新调用
- 2024-12-16 灵智互动|训练数据你不得不知道的问题
- 2024-12-16 机器学习基础:超参数和验证集 超参数是指
- 2024-12-16 中安表单识别AI训练平台的识别准确率是否可以通过测试来验证?
- 2024-12-16 天池伪造图像的篡改检测比赛TOP2/3方案分享
- 2024-12-16 【AI 和机器学习】PyTorch BASIC 基础知识(节2):数据集数据加载器
- 2024-12-16 Python实战——Iris数据集实战 iris数据集分析
你 发表评论:
欢迎- 最近发表
- 标签列表
-
- oraclesql优化 (66)
- 类的加载机制 (75)
- feignclient (62)
- 一致性hash算法 (71)
- dockfile (66)
- 锁机制 (57)
- javaresponse (60)
- 查看hive版本 (59)
- phpworkerman (57)
- spark算子 (58)
- vue双向绑定的原理 (68)
- springbootget请求 (58)
- docker网络三种模式 (67)
- spring控制反转 (71)
- data:image/jpeg (69)
- base64 (69)
- java分页 (64)
- kibanadocker (60)
- qabstracttablemodel (62)
- java生成pdf文件 (69)
- deletelater (62)
- com.aspose.words (58)
- android.mk (62)
- qopengl (73)
- epoch_millis (61)
本文暂时没有评论,来添加一个吧(●'◡'●)