使用python进行图片的文字识别

article/2025/11/5 8:40:05

使用python进行图片的文字识别

文章目录

  • 使用python进行图片的文字识别
    • 安装 Tesseract OCR
      • 安装过程
      • 配置系统的环境变量
    • 安装python的第三方库
      • Pytesseract库
      • Pillow库
    • 运行个demo

安装 Tesseract OCR

  • Tesseract OCR 是一款由 Google 团队开发的开源 OCR(Optical Character Recognition,光学字符识别)引擎,用于将图片、PDF 等格式中的文本转换为可编辑的文本格式。自 1985 年首次发布以来,它已经经历了多个版本和改进,并成为目前最受欢迎的 OCR 引擎之一。

    Tesseract OCR 支持多种语言,包括英语、中文、日语、俄语等等,而且具有较高的准确率和稳定性,尤其在处理大量文字的场景下表现突出。同时,该引擎还支持多线程处理,可以有效地提高识别速度。

  • 下载地址:Home · UB-Mannheim/tesseract Wiki (github.com)

  • Windows安装包: https://digi.bib.uni-mannheim.de/tesseract/tesseract-ocr-w64-setup-5.3.1.20230401.exe

  • 请添加图片描述

注意: 这是Windows64位系统安装包.

tesseract源码的GitHub地址:tesseract-ocr/tesseract: Tesseract Open Source OCR Engine ,有能力的可以自行编译源代码

安装过程

  • 双击tesseract-ocr-w64-setup-5.3.1.20230401.exe安装包进行安装

    请添加图片描述

    首先是选择语言界面,默认是英文, 没有中文,有其他国家的语言可以选。

  • Next

    请添加图片描述

  • I Agree

    请添加图片描述

  • 默认为这台电脑进行安装

    请添加图片描述

  • 因为需要在 Tesseract OCR 中识别中文简体等非英语文本,所有需要安装相应的语言数据。

请添加图片描述

可以只安装特定语言, 比如中文简体

请添加图片描述

  • 选择安装路径, 比如我选的是D:\Tesseract-OCR,待会配系统环境变量可能会用到这个安装路径。

    请添加图片描述

  • 创建快捷图标

    请添加图片描述

  • 安装中

    请添加图片描述

  • Next

    请添加图片描述

  • Finish

    请添加图片描述

  • 可以在开始菜单栏中看到Console

    请添加图片描述

  • 点进去就能直接进入控制台了

    请添加图片描述

  • 输入:tesseract --help试试

    请添加图片描述

    因为我们不是直接使用命令去操作这个tesseract, 而是使用python去操作它, 因此这个命令行就不用管他, 可以关掉。接下来为了让python能直接使用它, 需要检查系统的环境变量有没有设置好。

    在Windows操作系统中,环境变量用于存储一些系统或用户自定义的参数和路径信息。这些参数和路径信息可以帮助操作系统找到系统中安装的软件和程序,以便正确地运行它们。

  • 重新开个命令窗口

    请添加图片描述

    输入tesseract -v查看版本号,你可能会出现上面的情况, 就是没有配置好系统的环境变量,那就需要配置环境变量

    配置系统的环境变量

  • 以windows10的电脑为例, 打开电脑设置

    请添加图片描述

  • 点击系统, 找到关于,侧边有个高级系统设置, 点击去

    请添加图片描述

  • 可以看到环境变量, 点进去

    请添加图片描述

  • 找到系统变量中的Path选中, 再点击编辑

    请添加图片描述

  • 进入后点击新建

    请添加图片描述

  • 将安装路径复制进去,比如我安装的路径为D:\Tesseract-OCR

    请添加图片描述

  • 复制进去后点击确认

    请添加图片描述

  • 重新进入到命令行中

    输入tesseract -v, 若出现版本号则设置成功

    请添加图片描述

OK, tesseract算是安装完成了, 接下来使用python去操作它了!

安装python的第三方库

Pytesseract库

  • Pytesseract 是一个 Python 的 OCR(Optical Character Recognition,光学字符识别)库,可以用来将图片、PDF 等文件中的文本转换为可编辑的文本格式。它基于 Google 的 Tesseract OCR 引擎,支持多种语言,并且具有较高的准确率和稳定性。

  • 安装 Pytesseract 库可以使用 pip 工具快速完成。按照以下步骤进行操作:

    1. 打开命令行工具(Windows: cmd,Linux/macOS: Terminal)。

    2. 输入以下命令来安装 Pytesseract:

      pip install pytesseract
      
    3. 等待安装完成即可。

      请添加图片描述

    有一点需要注意的是,Pytesseract 库依赖于 Tesseract OCR 引擎,因此在安装 Pytesseract 之前请确保已安装 Tesseract OCR。如果还没有安装 Tesseract OCR,请先下载和安装它,然后再安装 Pytesseract。

  • 可以使用pip list 命令列出你已经安装的python库

    请添加图片描述

请添加图片描述

Pillow库

  • Pillow 是一个功能强大的图像处理库,可以处理多种格式的图像文件,支持图像处理、图像增强、图像转换等多种操作。
  • 因为识别图片需要用到PIL(Python Imaging Library)库中的 Image 模块

使用 pip 工具来安装 Pillow 库。以下是安装 Pillow 库的命令:

pip install pillow

安装完成后,就可以在 Python 中使用 from PIL import Image 来进行图像处理和操作了。

运行个demo

比如识别这张图

请添加图片描述

import pytesseract
from PIL import Image# 加载图片
img = Image.open('images/demo.png')# 转换为灰度图像
img = img.convert('L')# 识别文本, 使用pytesseract库进行OCR识别
text = pytesseract.image_to_string(img)# 输出识别结果
print(text)

注意: 默认识别英文和数字

识别效果:

请添加图片描述

因为都是中文, 识别不出来

  • 若要识别中文, 得进行配置 (前提是安装tesseract时要选择下载好中文简体数据包才能进行使用)
import pytesseract
from PIL import Image# 加载图片
img = Image.open('images/demo.png')# 转换为灰度图像
img = img.convert('L')# 识别文本, 使用pytesseract库进行OCR识别, 将语言设置成中文
text = pytesseract.image_to_string(img, lang='chi_sim')
# 输出识别结果
print(text)

请添加图片描述

这个识别的正确率还可以, 这取决于图片的质量和文字的清晰规整程度

OK, 上述只是简单的小例子,更多用法可以自行探索, 还可以设置其他参数来提高文字的识别正确率!

  • 使用说明文档https://github.com/madmaze/pytesseract/blob/master/README.rst

比如下面是官方的说明例子:

from PIL import Imageimport pytesseract# 如果您的PATH中没有tesseract可执行文件,请包括以下内容:
pytesseract.pytesseract.tesseract_cmd = r'<full_path_to_your_tesseract_executable>'
# 示例 tesseract_cmd = r'C:\Program Files (x86)\Tesseract-OCR\tesseract'# 简单的图像转字符串
print(pytesseract.image_to_string(Image.open('test.png')))# 为了绕过pytesseract的图像转换,只需使用相对或绝对图像路径
# 注意:在这种情况下,您应该提供tesseract支持的图像,否则tesseract将返回错误
print(pytesseract.image_to_string('test.png'))# 可用语言列表
print(pytesseract.get_languages(config=''))# 将法语文本图像转换为字符串
print(pytesseract.image_to_string(Image.open('test-european.jpg'), lang='fra'))# 使用包含多个图像文件路径列表的单个文件进行批处理
print(pytesseract.image_to_string('images.txt'))# 在一段时间后超时/终止tesseract作业
try:print(pytesseract.image_to_string('test.jpg', timeout=2)) # 在2秒后超时print(pytesseract.image_to_string('test.jpg', timeout=0.5)) # 半秒后超时
except RuntimeError as timeout_error:# tesseract处理已终止pass# 获取边界框估计
print(pytesseract.image_to_boxes(Image.open('test.png')))# 获取详细数据,包括框、置信度、行和页码
print(pytesseract.image_to_data(Image.open('test.png')))# 获取有关方向和脚本检测的信息
print(pytesseract.image_to_osd(Image.open('test.png')))# 获取可搜索的PDF
pdf = pytesseract.image_to_pdf_or_hocr('test.png', extension='pdf')
with open('test.pdf', 'w+b') as f:f.write(pdf) # pdf类型默认为bytes# 获取HOCR输出
hocr = pytesseract.image_to_pdf_or_hocr('test.png', extension='hocr')# 获取ALTO XML输出
xml = pytesseract.image_to_alto_xml('test.png')

http://chatgpt.dhexx.cn/article/j5mQwCwo.shtml

相关文章

python图片ocr识别手写印刷体中英文字体

脚本说明: 脚本需要修改 APPID 以及 API_KEY的值&#xff0c;请到讯飞api平台获取。 首先截图&#xff0c;然后打开脚本直接运行&#xff0c;该脚本自动识别剪切板上内容&#xff0c;脚本运行结束后&#xff0c;直接crtlv复制。 # -*- coding: utf-8 -*- import base64 impor…

Python识别发票图片

1.先去百度云官网注册登录&#xff0c;然后创建一个应用 2.创建应用后会有API KEY 和 Secret Key 3.获取token&#xff0c;在接口中填入API Key 和Secret Key import requests host https://aip.baidubce.com/oauth/2.0/token?grant_typeclient_credentials&client_idAP…

python图像识别与提取_python图像识别与提取

广告关闭 腾讯云11.11云上盛惠 ,精选热门产品助力上云,云服务器首年88元起,买的越多返的越多,最高返5000元! 从机器学习的的角度来说,首先要提取图片的特征,将这些特征进行分类处理,训练并建立模型,然后在进行识别。 但是让计算机去区分这些图片分别是哪一类是很不容…

【pytesseract】python图片识别OCR库

目录 一、pytesseract简介1.1 pytesseract库1.2 pytesseract用途 二、pytesseract安装2.1 安装和配置底层应用Tesseract-OCR2.1.1 GitHub 官网地址&#xff1a;查看源码2.1.2 官网安装包&#xff1a;下载2.1.3 安装Tesseract-OCR2.1.4 配置环境变量2.1.5 查看Tesseract-OCR是否…

python识别图片表格内容

python-opencv表格识别 文章目录 python-opencv表格识别前言一、环境准备二、tesseract-OCR搭建1.tesseract-OCR2.debug tesseract 三、源码1.源码2.运行结果 总结 前言 提示&#xff1a;以下是本篇文章正文内容&#xff0c;python环境的搭建这里暂不做介绍&#xff0c;不会的…

python图片识别之tesseract

经过两个下午的尝试&#xff0c;终于搞出来了&#xff1b;特记录下来备忘&#xff1b; 首先来看python代码识别图片&#xff0c;这一段较为简单&#xff1b; from PIL import Image # import tesserocr # 完全可以不用这个 import pytesseractimage Image.open(rhahah.jpg)…

Python OCR识别图片

OCR技术是光学字符识别的缩写(Optical Character Recognition)&#xff0c;是通过扫描等光学输入方式将各种票据、报刊、书籍、文稿及其它印刷品的文字转化为图像信息&#xff0c;再利用文字识别技术将图像信息转化为可以使用的计算机输入技术。可应用于银行票据、大量文字资料…

Python图片识别——人工智能篇

目录 一、安装pytesseract和PIL PIL全称&#xff1a;Python Imaging Library&#xff0c;python图像处理库&#xff0c;这个库支持多种文件格式&#xff0c;并提供了强大的图像处理和图形处理能力。 由于PIL仅支持到Python 2.7&#xff0c;所以在PIL的基础上创建了Pillow库&…

部署kvm

实验需求&#xff1a; 1、部署kvm 2、使用WebVirtMgr的WEB界面管理 3、在该WEB界面中安装一台Linux操作系统 环境说明&#xff1a; 系统&#xff1a;CentOS7 IP&#xff1a;192.168.253.145 1. CPU虚拟化功能 部署前请确保你的CPU虚拟化功能已开启&#xff0c;分为两种情况…

KVM是什么 机柜 机架服务器 怎么用

多个刀片服务器连接到KVM&#xff0c;使用KVM对它们进行统一管理 每个服务器在KVM上有一个序号&#xff0c;切换序号&#xff0c;桌面就会进入到对应的服务器 是看PORT ID 上面的ON LINE哪些灯亮&#xff0c;则代表连上了哪几个服务器

linux服务器部署kvm

1.查看系统版本 [rootlocalhost ~]# cat /etc/centos-release CentOS Linux release 7.5.1708 (Core)2.检查是否开启虚拟化。有VMX或者svm [rootlocalhost ~]# cat /proc/cpuinfo | egrep vmx|svm如果没有数据显示的话&#xff0c;关闭虚拟机&#xff0c;点击虚拟机设置。 3…

KVM服务器安装详解及其应用(Services02 DAY01)

安装一台KVM服务器  问题 本例要求安装一台可用的KVM服务器&#xff1a; 准备一台CentOS6服务器安装虚拟化相关包组启动libvirtd服务  方案 在CentOS6系统中&#xff0c;KVM虚拟化相关的软件组包括四个&#xff1a;虚拟化、虚拟化客户端、虚拟化工具、虚拟化平台&#xff…

服务器的虚拟kvm是什么,服务器 配置虚拟kvm功能

服务器 配置虚拟kvm功能 内容精选 换一换 Linux操作系统XEN实例变更为KVM实例前&#xff0c;必须完成驱动的安装和配置。本节操作指导您手动安装Linux云服务器驱动、配置磁盘自动挂载等&#xff0c;并将XEN实例变更为KVM实例。如需使用自动化脚本安装驱动的方法请参考XEN实例变…

kvm云服务器虚拟化,kvm虚拟化 云服务器

kvm虚拟化 云服务器 内容精选 换一换 用户在华东区创建了一个保护组及其保护实例&#xff0c;如表1所示。删除该保护实例&#xff0c;但不删除容灾站点服务器。然后在弹性云服务器页面&#xff0c;卸载容灾站点服务器的云硬盘&#xff0c;并将该云硬盘挂载给可用区AZ1中的其他云…

搭建KVM服务器(1)

安装虚拟化服务器平台 虚拟化概念 • KVM /QEMU /LIBVIRTD – KVM是linux内核的模块,它需要CPU的支持,采用硬件辅劣虚拟化技术 Intel-VT,AMD-V,内存的相关如Intel的 EPT 和 AMD 的 RVI 技术。 – QEMU 是一个虚拟化的仿真工具,通过 ioctl 不内核kvm 交互完成对硬件的虚拟化支…

稳定kvm服务器vps,kvm的服务器vps

kvm的服务器vps 内容精选 换一换 oVirt Engine是运行在基于JBoss的Java应用程序。该服务与主机上的VDSM进行通信&#xff0c;以部署、启动、停止、迁移和监控VM&#xff0c;并且还可以通过模板在存储上创建新的镜像。oVirt Engine以可扩展性、安全性、高性能为基础的架构技术&a…

维护华为服务器的好工具KVM

以前维护服务器&#xff0c;要么打开远程桌面&#xff0c;要么打开telnet&#xff0c;或者使用其他的远程工具&#xff0c;今天维护一台新购买的华为服务器&#xff0c;使用了华为官网下载的KVM&#xff0c;真好用&#xff01; 使用网线&#xff0c;找到Mgmt的网口插入&#xf…

服务器系统kvm安装,云服务器安装kvm

云服务器安装kvm 内容精选 换一换 安装完操作系统后的临时云服务器需要进行相关配置&#xff0c;并安装原生的XEN和KVM驱动&#xff0c;才能保证后续创建的云服务器正常使用。该任务指导用户完成Linux云服务器的相关配置与驱动安装&#xff0c;从而创建为Linux系统盘镜像。配置…

vnc远程管理kvm,在办公室连接kvm服务器

文章目录 vnc远程管理kvm vnc远程管理kvm vnc概念图 首先试试服务器装了VNC没 rpm -q tigervnc tigervnc-server没安装的话会直接出现 package tigervnc is not installed package tigervnc-server is not installed第一步&#xff0c;安装VNC packages&#xff1a; yum …

安装一台KVM服务器

1.安装一台KVM服务器 问题 本例要求安装一台可用的KVM服务器&#xff1a; 1)准备一台CentOS6服务器 2)安装虚拟化相关包组 3)启动libvirtd服务 方案 在CentOS6系统中&#xff0c;KVM虚拟化相关的软件组包括四个&#xff1a;虚拟化、虚拟化客户端、虚拟化工具、虚拟化平台&a…