计算机系统应用教程网站

网站首页 > 技术文章 正文

人工智能技术-光学字符识别~开课吧

btikc 2024-10-01 08:24:43 技术文章 12 ℃ 0 评论

人工智能的核心思想在于构造智能的人工系统。人工智能是一项知识工程,利用机器模仿人类完成一系列的动作。为了帮助大家深入了解人工智能技术,需要搞清楚人工智能技术光学字符识别。

光学字符识别(Optical Character Recognition,OCR)

OCR技术是指利用电子设备(例如扫描仪或数码相机)将纸质文档中的文字转换成为黑白点阵的图像文件,并通过识别软件将图像中的文字转换成文本格式,供文字处理软件进一步编辑加工的技术。通俗地说就是,对文本资料进行扫描,然后对图像文件进行分析处理,以获取文字及版面信息的技术。

OCR的识别流程:

1、图像处理

针对图像的成像问题进行修正。常见的图像预处理过程包括:几何变换(透视、扭曲、旋转等)、畸变校正、去除模糊、图像增强和光线校正、二值化处理等。

2、文字检测

检测文本所在位置、范围及其布局,通常还包括版面分析和文字行检测等。文字检测解决的主要问题是哪里有文字,文字的范围有多大。

文字检测采用的处理算法一般包括:Faster-RCNN、Mask-RCNN、FPN、PANet、Unet、IoUNet、YOLO、SSD。

3、文字识别

在文本检测的基础上,对文本内容进行识别,将图像中的文本信息转化为计算机可识别和处理的文本信息。文字识别主要解决的问题是每个文字是什么。

文字识别常采用的处理算法包括:CRNN、Attention OCR、RNNLM、BERT。

4、文本抽取

从文字识别结果中抽取出需要的字段或要素。

文本抽取常采用的处理算法包括:CRF、HMM、HAN、DPCNN、BiLSTM+CRF、BERT+CRF、Regex。

5、输出

输出最终的文字识别结果或者文本抽取结果。

人工智能应用场景-智能医疗~开课吧

人工智能的积极社会效应

浅谈人工智能发展历程

本文暂时没有评论,来添加一个吧(●'◡'●)

欢迎 发表评论:

最近发表
标签列表