计算机系统应用教程网站

网站首页 > 技术文章正文

大厂开源真香，百度开源的超轻量级OCR工具库强大且实用

btikc 2024-09-08 12:05:37 技术文章 51 ℃ 0 评论

项目名称：PaddleOCR

项目作者：PaddlePaddle

开源许可协议：Apache-2.0

项目地址：https://gitee.com/paddlepaddle/PaddleOCR

项目简介

PaddleOCR 旨在打造一套丰富、领先、且实用的 OCR 工具库，助力使用者训练出更好的模型，并应用落地。

PaddleOCR 是基于飞桨的 OCR 工具库，包含总模型仅8.6M的超轻量级中文 OCR，单模型支持中英文数字组合识别、竖排文本识别、长文本识别。同时支持多种文本检测、文本识别的训练算法。

项目特性

超轻量级中文OCR模型，总模型仅8.6M

单模型支持中英文数字组合识别、竖排文本识别、长文本识别
检测模型DB（4.1M）+识别模型CRNN（4.5M）

使用通用中文OCR模型
多种预测推理部署方案，包括服务部署和端侧部署
多种文本检测训练算法，EAST、DB
多种文本识别训练算法，Rosetta、CRNN、STAR-Net、RARE
可运行于Linux、Windows、MacOS等多种系统

效果展示

算法介绍

1.文本检测算法

2.文本识别算法

3.端到端 OCR 算法

数据集

PaddleOCR 还为开发者们提供了多种数据集和工具供大家选择使用

通用中英文OCR数据集
手写中文OCR数据集
垂类多语言OCR数据集
常用数据标注工具
常用数据合成工具

有一说一，这次百度开源的这款 OCR 工具集确实非常不错，如果你对它也感兴趣，想要了解更多信息的话，那么就点击下方了解更多前往项目主页看看吧。

上一篇：自动化:利用excel开源库自动生成文档，解决重复性操作
下一篇：大小只有8.6M!百度开源超轻量中英文OCR模型爆红Github

猜你喜欢

2024-09-08 重新思考工业物联网预测性维护
2024-09-08 东软载波新注册《EASTSOFT DDZY1687-Z型单相费控智能电能表软件V1.0》等2个项目的软件著作权
2024-09-08 字节二面，让写一个LFU缓存策略算法，懵了
2024-09-08 苹果收购英国影像公司，iPhone摄像功能或将更上一层楼
2024-09-08 苹果再收购!iPhone影像功能或将得到升级
2024-09-08 回溯算法，择优搜索:树的深搜+剪枝
2024-09-08 图像识别没你想的那么难!看完这篇你也能成专家
2024-09-08 PaddleOCR又一款开源中文文字识别，支持轻量级、通用级文字
2024-09-08 OCR 检测和识别算法分别都有那些
2024-09-08 几种常见的数据分区方法

本文暂时没有评论，来添加一个吧(●'◡'●)

取消回复欢迎你发表评论:

最近发表