网站首页 > 技术文章 正文
人工智能的核心思想在于构造智能的人工系统。人工智能是一项知识工程,利用机器模仿人类完成一系列的动作。为了帮助大家深入了解人工智能技术,需要搞清楚人工智能技术光学字符识别。
光学字符识别(Optical Character Recognition,OCR)
OCR技术是指利用电子设备(例如扫描仪或数码相机)将纸质文档中的文字转换成为黑白点阵的图像文件,并通过识别软件将图像中的文字转换成文本格式,供文字处理软件进一步编辑加工的技术。通俗地说就是,对文本资料进行扫描,然后对图像文件进行分析处理,以获取文字及版面信息的技术。
OCR的识别流程:
1、图像处理
针对图像的成像问题进行修正。常见的图像预处理过程包括:几何变换(透视、扭曲、旋转等)、畸变校正、去除模糊、图像增强和光线校正、二值化处理等。
2、文字检测
检测文本所在位置、范围及其布局,通常还包括版面分析和文字行检测等。文字检测解决的主要问题是哪里有文字,文字的范围有多大。
文字检测采用的处理算法一般包括:Faster-RCNN、Mask-RCNN、FPN、PANet、Unet、IoUNet、YOLO、SSD。
3、文字识别
在文本检测的基础上,对文本内容进行识别,将图像中的文本信息转化为计算机可识别和处理的文本信息。文字识别主要解决的问题是每个文字是什么。
文字识别常采用的处理算法包括:CRNN、Attention OCR、RNNLM、BERT。
4、文本抽取
从文字识别结果中抽取出需要的字段或要素。
文本抽取常采用的处理算法包括:CRF、HMM、HAN、DPCNN、BiLSTM+CRF、BERT+CRF、Regex。
5、输出
输出最终的文字识别结果或者文本抽取结果。
猜你喜欢
- 2025-02-24 科研下苦功 算法更聪明
- 2025-02-24 四类异常检测算法综述:Isolation Forest、LOF、PCA及DAGMM
- 2025-02-24 聚焦创新周:解决高空抛物难题 小视科技带来智能检测解决方案
- 2025-02-24 人工智能算法探秘:地平线技术三剑客解读
- 2025-02-24 云从科技:在人脸识别算法测试NIST-FRVT中 公司获两项冠军
- 2025-02-24 智能移动机器人导航算法的测试与验证何解?
- 2025-02-24 开易(北京)科技有限公司取得一种算法模型的筛选方法、装置及测试平台专利
- 2025-02-24 A/B测试算法大揭秘第四篇:置信区间究竟是怎么来的?
- 2025-02-24 从人工判断到算法检测,这种技术为轴承缺陷检测装上“科技眼睛”
- 2025-02-24 介绍一种基于道路分类特性的超快速车道检测算法
你 发表评论:
欢迎- 最近发表
- 标签列表
-
- oraclesql优化 (66)
- 类的加载机制 (75)
- feignclient (62)
- 一致性hash算法 (71)
- dockfile (66)
- 锁机制 (57)
- javaresponse (60)
- 查看hive版本 (59)
- phpworkerman (57)
- spark算子 (58)
- vue双向绑定的原理 (68)
- springbootget请求 (58)
- docker网络三种模式 (67)
- spring控制反转 (71)
- data:image/jpeg (69)
- base64 (69)
- java分页 (64)
- kibanadocker (60)
- qabstracttablemodel (62)
- java生成pdf文件 (69)
- deletelater (62)
- com.aspose.words (58)
- android.mk (62)
- qopengl (73)
- epoch_millis (61)
本文暂时没有评论,来添加一个吧(●'◡'●)