python--识别图片中的文字

article/2025/9/22 3:32:17

本篇文章主要参考了 python图像处理之识别图像中的文字 这篇文章,在实现的过程中出现了些偏差,特此记录。因为此时笔者不是第一次安装,所展示的结果会和首次安装的结果有所差别。

1.安装PIL

以管理员的身份打开命令提示符,输入:pip install pillow.

(注:PIL是python平台事实上的图像处理标准库,但PIL仅支持到python2.7,加上年久失修,于是在PIL的基础上创建了兼容的版本pillow,支持最新的python3.X。)

 

2.安装pytesser3

打开命令提示符,输入:pip install pytesser3

 

3.安装pytesseract

打开命令提示符,输入:pip install pytesseract

 

4.安装autopy3

先安装wheel,即先在命令提示符中输入pip install wheel。

下载autopy3-0.51.1-cp36-cp36m-win_amd64.whl。点击此处下载,此时该文件所在目录为D:\liuyan\autopy3-0.51.1-cp36-cp36m-win_amd64.whl。

在命令提示符中输入: pip install D:\liuyan\autopy3-0.51.1-cp36-cp36m-win_amd64.whl

 

5.安装Tesseract-OCR

5.1 下载安装包

百度搜索Tesseract-OCR下载   Tesseract-orc-setup-3.02.02.exe   。要记得自己的安装目录(博主的安装路径为:C:\Program Files(x86)\Tesseract-OCR),等会配置环境变量要用。

如果不是做英文的图文识别,还需要下载其他语言的识别包  其他语言各版本的识别包下载  ,如简体字识别包对应的是chi_sim.traineddata ,繁体字识别包对应的是chi_tra.traineddata 。

5.2 安装

具体安装步骤可参考光学字符识别引擎Tesseract-ocr安装过程 。

5.3 配置环境变量

博主的安装路径为:C:\Program Files(x86)\Tesseract-OCR。电脑属性--高级系统设置--环境变量,进入如下界面。

把刚刚的安装路径"C:\Program Files(x86)\Tesseract-OCR"添加到用户变量和系统变量的path中,注意,添加的时候开头用";"跟之前的变量隔开,以";"结尾。配置好后点击确定。

打开命令终端,输入:tesseract -v,可以看到版本信息。

到这里,我们就算安装完成了。但是,我们的系统还是无法识别中文的,要去下载简体汉字、繁体汉字语言包(其他语言各版本识别包下载),下载好之后放到安装目录的tessdata目录下即可。

注:此处的安装过程参考Window环境安装tesseract-ocr 4.00并配置环境变量  。

5.4 验证是否安装成功

进入cmd窗口,敲入命令cd C:\Program Files (x86)\Tesseract-OCR,再输入tesseract,若有如下信息则表示安装成功。

还可以用命令tesseract --list-langs来查看Tesseract-OCR支持的语言。

 

入门使用

window中运行tesseract(参考 OCR开源软件Tesseract的下载和入门使用)

1.tesseract是一个命令行OCR程序,打开一个终端(Win+R),输入语法如下:

tesseract 输入图片的文件名 输出文件的文件名 [-l lang][-psm pagesegmode][configfile...]

例如:识别 微信图片5.png 图像,将识别结果存入 out2.txt,如下

 

2.用pycharm进行图像中的汉字识别

要识别的原图如下:(来自小华的《烟火里的尘埃》)

实现的代码如下:

import  pytesseract
from PIL import Image
im=Image.open(r'C:\Users\名字被抢了\desktop\图片2.png')
print(pytesseract.image_to_string(im,lang='chi_sim'))

效果图

识别的效果不是很好,有待于进一步提高正确率。


http://chatgpt.dhexx.cn/article/YuScMRn7.shtml

相关文章

图片中文字的识别

主要用到tesseract这个工具,以及pytesseract和pillow两个库。 首先下载tesseract这个工具,下载地址: Index of /tesseracthttps://digi.bib.uni-mannheim.de/tesseract/ 根据自己电脑系统进行下载,下载后安装,安装的…

文字识别:Tesseract OCR

一、安装并配置Tesseract 1、下载Tesseract-OCR (网上直接下载即可) 2、双击安装,选择所有人均可使用,避免权限问题 勾选最后一项添加语言包,但是全部勾选需要1.3G,可以点开加号,选择自己所需的…

如何识别图片中的文字

工具/原料 http://jingyan.baidu.com/article/ae97a64699f19dbbfc461d47.html WPS办公软件 AJViewer文字识别软件 准备工作 1 下载软件 ① 在“百度搜索”中输入这2款软件的软件名进行下载。 ② 在“百度网盘”下载,地址是:http://pan.baidu.com/share/l…

免费在线图片识别文字工具

在平时工作中,经常会遇到这样的场景:将图片转为文字。如果只需处理一两张图片或者PDF,用键盘敲文字占用的时间也不会很长。如果文件非常多,用电脑把这些文字全部敲出来,太浪费时间了?有没有一款工具&#x…

图像文字识别

图像文字识别 (结尾附样例展示) 以下为与图像通用识别的 Python示例代码* #!/usr/bin/env python #codingutf-8from aliyunsdkcore.client import AcsClient from aliyunsdkcore.acs_exception.exceptions import ClientException from aliyunsdkcore.…

OCR文字识别

OCR定义和起源 OCR (Optical Character Recognition,光学字符识别)是指电子设备(例如扫描仪或数码相机)检查纸上打印的字符,通过检测暗、亮的模式确定其形状,然后用字符识别方法将形状翻译成计…

图片识别文字

浏览链接:http://116.62.147.89:8081/OCRUtil/index.html 最终结果图: 如果已经有access_token,请直接跳到第6步 1,注册并登录百度 2,选择管理控制台 3,选择文字识别 4,选择创建应用 按要求填写…

识别图片文字怎么弄?我来教大家怎么识别图片中的文字

有时,我们需要从图片中提取文本以进行编辑或搜索。虽然手动转录是一种选项,但这是费时费力的工作,而且容易出错。为了解决这个问题,出现了各种各样的技术和工具,可以帮助我们自动识别图片中的文字。在本文中&#xff0…

如何识别图片文字?这几个方法助你轻松搞定

你是否有遇到过这样的经历?收到了领导发来的一份资料,但是很多是图片格式,而我们需要用到图片中的文字内容,这时你会怎么解决呢?如果使用传统的方法,一字一句打出来的话,无疑会增加我们的工作。…

navicat12简体中文专业版免费使用教程

1、Navicat Premium 12是一套数据库开发管理工具,支持连接 MySQL、Oracle等多种数据库,可以快速轻松地创建、管理和维护数据库。本教程绝对可用,不像其他的都是大多数搬运别人的文章,也不试试能不能用,简直是浪费大家的…

实测可用 Navicat Premium 12破解解决方案

1.下载安装 64位简体中文版https://pan.baidu.com/share/init?surlk9dYays0z7EdOVNgDS_bQw 提取码:7w9a 2.安装上面版本 3.下载破解补丁https://pan.baidu.com/s/19ct4Afc3bTPdTa35Pldvqg 提取码:r2e5 开始破解: 一.选择补丁版本 简体…

工具篇:Navicat-12版本破解安装

Navicat 12 破解方式,亲测有效 方法如下: 先安装 navicat的exe包将简体中文63位里面的两个文件复制到navicat的安装根目录打开软件,开始会提示你试用到1899年,以后点击试用,就可以一直试用了。就是这么简单。 上面提…

Day15_08_Navicat for MySQ中文破解版(无需激活码)安装教程

Navicat for MySQ中文安装教程 一. 下载中文pojieban Navicat for MySQ 链接: https://pan.baidu.com/s/1DO8yJnvTfBndZJ6Hprr7Og 提取码: ik7d 二. 解压下载后的文件 文件中有两个.exe文件,点击navicat111_mysql_cs_x64.exe 进行安装 三. 点击PatchNavicat.exe选择安装Nav…

Navicat for MySQ中文破解版(无需激活码)

Navicat for MySQ中文破解版(无需激活码) 转载自:https://blog.csdn.net/a599174211/article/details/82795658 1、下载破解版Navicat for MySQ中文破解版 2、解压下载后的文件有两个.exe文件,点navicat111_mysql_cs_x64.exe 进行安装 3、安…

Navicat premium for Mac 12 破解 纯手工

今天用了一天的时间,寻找破解方法。终于找到大神的破解教程。即使在教程下,也折磨了好久。记录一下,方便以后学习。 测试环境:MacOS High Sierra 10.13.4 Windows版破解教程请看 https://www.52pojie.cn/thread-688820-1-1.html破…

Navicat Premium 12 中文版v12.1.19

nacicat premium 12中文版是mac平台上一款易于使用的多连接数据库管理工具,它可以帮助您在单个应用程序中同时连接到MySQL,Oracle,SQL Server,SQLite和PostgreSQL数据库,让对多种数据库的数据库管理变得非常简单,而且Navicat Premium成功结合了其他Navicat成员的功能,并…

navicat 12 for mac 中文破解版使用说明

1. 将下载的Navicat_Premium中文破解版.zip,下载完成后,解压出现如下图两个文件 2. 打开Navicat_Premium_12.0.22.dmg。如果出现打开失败这种情况,请打开mac的未知源选项 打开命令行输入如下代码: sudo spctl --master-disable …

Navicat Premium for Mac 11.1.8 免费中文破解版下载

之前安装的一款数据库软件Navicat试用版本到期了,所以在网上找了一款破解永久使用版Navicat Premium for Mac 11.1.8 完美破解版,完美支持OS X 10.10, 简体中文版,Navicat是最优秀的数据库图形化管理客户端,支持MySQL、SQL Server…

Navicat fro oracle 简体中文破解版(亲测可用)

简单点,直接上货了. 1.下载Navica安装,本人是64位,链接如下(内含使用说明): https://download.csdn.net/download/banglong0/10716809 2.打开Navicat,新建链接。 3.配置连接参数 (注意:箭头标记一定要与在Oracle下载目录下搜索tnsnames.ora 中的SERVICE_NAME一致…

Navicat Premium 11.2.7 中文破解版安装

1.进入链接:下载Navicat Premium;如果链接不存在,可进入网盘下载 2.下载完成解压zip文件,可得到如下文件;选择(x32位和x64位),安装Navicat Premium 3.安装完成后点击PatchNavicat.e…