博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
基于Python37配置图片文字识别
阅读量:7042 次
发布时间:2019-06-28

本文共 957 字,大约阅读时间需要 3 分钟。

 

以管理员权限打开cmd控制台。

1.如何安装PIL

输入下面命令:pip install Pillow

参考:

2.安装pytesseract

输入下面命令:pip install pytesseract

详细见下图:

3.安装文字识别包tesseract-ocr()

tesseract识别算法开源代码见。

下载如下链接中的安装exe文件进行安装:

安装路径如下:C:\Program Files (x86)\Tesseract-OCR

注意:请将所有可以勾选的都勾选上

4.修改Python37中的pytesseract.py配置。

打开文件C:\Program Files\Python37\Lib\site-packages\pytesseract\pytesseract.py,将下面语句找到

# CHANGE THIS IF TESSERACT IS NOT IN YOUR PATH, OR IS NAMED DIFFERENTLY

tesseract_cmd = 'tesseract'

替换成

# CHANGE THIS IF TESSERACT IS NOT IN YOUR PATH, OR IS NAMED DIFFERENTLY

#tesseract_cmd = 'tesseract'
tesseract_cmd = 'C:\\Program Files (x86)\\Tesseract-OCR\\tesseract.exe'

 5.测试一下安装是否成功。

在D盘底下新建一个文件夹tesseractTest,并在该文件夹底下新建一个文件testTesseract.py, 内容如下:

1 # _*_ coding: utf-8 _*_2 from PIL import Image3 import pytesseract4 5 aaa = pytesseract.image_to_string(Image.open('aaa.png'), lang='chi_sim')6 print(aaa)

新开一个cmd终端,执行如下语句:

python testTesseract.py

可以看到下图中的输出:

其中aaa.png和bbb.png内容如下:

aaa.png

bbb.png

转载地址:http://suxal.baihongyu.com/

你可能感兴趣的文章
Android第五课 编译错误分析
查看>>
VS_远程调试
查看>>
博为峰Java技术题 ——JavaSE Java实现在不同编码之间进行文件转换
查看>>
Throws与Throw
查看>>
php趣味编程 - php求黑色星期五
查看>>
zabbix安装
查看>>
ELK之权限管理
查看>>
×_7_12_2013 I: Light on or off
查看>>
JIT
查看>>
巧用escalations限制Nagios报警次数 - [Nagios
查看>>
Entity SQL与LINQ TO Entity的本质区别
查看>>
python unittest 深入failfast及实际应用【示例】
查看>>
MSSQL中文排序规则设置
查看>>
30 个有关 Python 的小技巧
查看>>
CDN下nginx获取用户真实IP地址
查看>>
Jsp技术总结
查看>>
Sakai 11.x Build Failure
查看>>
面向对象+模块化设计绘制canvas星空动画
查看>>
Elastic Search学习笔记3——集群配置
查看>>
Unity客户端资源智能管理
查看>>