前言

OCR （Optical Character
Recognition，光学字符识别）是指电子设备（例如扫描仪或数码相机）检查纸上打印的字符，通过检测暗、亮的模式确定其形状，然后用字符识别方法将形状翻译成计算机文字的过程。

本文基于labview设计了一个学号识别系统，可以识别学生卡上学号并保存在文件中，同时也可以识别身份证号、名片电话等。

该系统包含图像获取、图像处理、数据输出，是一个综合性的设计，作为学习labview的阶段性练习。

运行环境

本系统运行在labview2020或2018环境，需要安装labview的视觉组件。

安装过程

彩色图像：由RGB三原色数值排列表示一个像素，有RGB888（24位）和RGB565（16位）等格式。其中，24位全彩色图像中的每个像素占据3个byte的空间，分别表示RGB3个通道，总共可以显示 $256^3$ 种颜色
灰度图：由灰度信息表示一个像素（8位，0-255：0表示最暗色，255表示最亮色），每个像素存放在一个byte空间
二值图像：由二值信息表示一个像素，每个下昂苏存放在一个bit空间

OCR（光学字符识别）是指机器自动从图像中识别文本字符的过程，是目标分类和识别的一种应用，包括训练与分类过程，可用于对被测件的识别和分类。

OCR训练过程主要从图像中提取用于字符识别的特征向量，并对各字符图像赋予准确的字符值。具有相同字符值的字符样本图像构成一个字符类，该类可以用其中一个最能代表该类字符的样本图像来代表，称为参考字符。字符训练完成后，就可得到一个用于对字符进行识别的字符集。

OCR对图像中的文本进行读取时，会先将图像中的各个字符图像分割开来，并将字符的特征向量与字符集中保存的特征向量进行对比，选取满足条件的最佳匹配向量所对应的字符值作为读取识别结果。若有必要，也可以通过字符验证过程对OCR的识别质量进行验证。

常见的OCR识别应用包括：药品包装标签识别、IC芯片编码读取、冲压零件上的字符识别、汽车零件编码读取以及车牌识别等。

利用Labview的Vision模块的OCR组件可以实现从训练到识别的过程。

机器视觉系统开发过程中常见的特征包括像素灰度、边缘、轮廓和形状、纹理、角点、色彩以及各种与图像颗粒相关的属性等。

本文进行OCR识别的对象为学生卡或其他证件，一般有明显的数字特征，字体之间有明确间隔，字体背景为浅颜色，故获取彩色图像后，需要对其灰度化、增强亮度和对比度处理。这些函数都可以在labview的vision组件中找到

利用labview的文件I/O组件可以实现将字符串换行写入txt文件中，实现OCR识别结果的存储。

程序图

程序框图

最终效果

开启摄像头

图像处理 ·

OCR的字符集可由Nl OCR训练器应用程序离线训练得到。

OCR识别程序

利用IMAQ OCR Create Session VI ，创建OCR会话，返回句柄。
利用IMAQ OCR Read Character Set File
VI读取字符集studentnumber.abc，添加到读取过程使用的训练字符集。
Labview的Image可以创建ROI属性节点，框选区域，输出矩形对角坐标。创建鼠标释放事件，当框选结束时，执行对框选区域的OCR识别。
利用IMAQ Clear Overlay VI，清除图像覆盖，保证识别帧为最新一帧。
利用IMAQ OCR Read Text 3
VI，利用训练字符集读取ROI框选图像中的文本，将每个对象与字符集的每个字符比较，选择与对象最匹配的字符，输出为字符串。