EasyOCR是由Python实现的光学字符识别(OCR)工具。
Install pytorchpytorch是一个使用GPU和CPU进行深度学习的优化张量库。(https://pytorch.org/docs/stable/index.html)
PyTorch是一个开源的Python机器学习库,基于Torch,用于自然语言处理等应用。(https://baike.baidu.com/item/PyTorch/24269838?阿拉丁).
PyTorch官网:https://pytorch.org/
网页(https://PyTorch.org/get-started/locally/#windows-python)详细介绍了pytorch安装的前提条件、方法及相关注意事项,截图如下:
有趣、有用比较强大的功能就是上图中的表格,根据不同的选择可以生成相应的安装命令.我选择了Windows,Pip,Python,CPU(不适用于CUDA),得到了相应的安装命令:pip3 install torch torchvision torchaudio.
在Win10命令行窗口中,执行上述命令(前提是安装了Python和pip)。结果如下图所示:
顺便说一下,pip是用命令“python . exe-m pip install-upgrade pip”更新的。
使用网页(https://pytorch.org/get-started/locally/#windows-python)的“验证”部分介绍的代码来检查安装的正确性。
python
import torch
x = torch.rand(5, 3)
print(x)
执行结果如下图所示:
应该是安装成功了。
安装easy ocr Web https://www.jaided.ai/easyocr/install/
本文介绍了EasyOCR的安装方法(本网页预装部分第一句话的意思是“对于Windows,你可能需要手动安装pytorch”,是Python 3.10.4会自动下载安装吗?以后有空可以试试),用pip安装的命令是:pip install easyocr.
在win10命令行窗口执行上述命令的结果如下图所示(耗时较长;如果长时间没有响应,按回车键试试安装是否已经完成):
因为内容比较多,所以正文部分附在最后。
安装完成后,会在“d : \ programs \ python \ python 310 \ scripts”目录下添加几个exe文件。
使用EasyOCR识别图片中的文字。jaided网站上的例子会对比网页“https://www . jai ded . ai/easy ocr/tutorial/”中的图片
另存为文件“d:\temp”
\chinese_tra.jpg”,在python中依次执行下列命令(代码):import easyocr
reader = easyocr.Reader(<'ch_tra', 'en'>)
result = reader.readtext(r'd:\temp\chinese_tra.jpg')
当执行代码“reader = easyocr.Reader(<'ch_tra', 'en'>)”时,程序自动通过互联网下载了检测模型和识别模型。提示信息及翻译如下:
CUDA not available - defaulting to CPU. Note: This module is much faster with a GPU.
(没有CUDA-缺省使用CPU。注意:这个模块在GPU上运行效率更高)
Downloading detection model, please wait. This may take several minutes depending upon your network connection.
(正在下载检测模型,请等待。花费时间取决于您的网络)
Downloading recognition model, please wait. This may take several minutes depending upon your network connection.
(正在下载识别模型,请等待。花费时间取决于您的网络)
没有找到CUDA是因为我在安装Pytorch时没有选择安装CUDA。
EasyOCR使用检测模型匹配图片中的文字,也就是找到图片中的文字;找到之后使用识别模型进行文字识别。
其中的'ch_tra'和'en'是语言标识,'ch_tra'表示古汉语,'en'表示英语。EasyOCR支持的语言在网页“ https://www.jaided.ai/easyocr/ ”中列出。
下载的模型文件保存在“C:\Users\zhang\.EasyOCR\model”(其中zhang是用户名,随计算机用户的不同而不同)目录中,如下图所示:
代码“result = reader.readtext(r'd:\temp\chinese_tra.jpg')”的结果显示信息过于详细,可以使用“result = reader.readtext(r'd:\temp\chinese_tra.jpg', detail = 0)”或“result = reader.readtext(r'd:\temp\chinese_tra.jpg', detail = 0, paragraph=True)”代替,执行结果如下图所示:
执行结果与网页“ https://www.jaided.ai/easyocr/tutorial/ ”中的一致。
车牌的识别(有识别错误)文件名“D:\temp\chepai.png”,图片内容如下:
因为车牌中有简体中文、英文和数字,所以使用下列命令:
reader = easyocr.Reader(<'ch_sim', 'en'>)
result = reader.readtext(r'd:\temp\chepai.png', detail = 0, paragraph=True)
result
执行结果如下图所示:
在执行代码“reader = easyocr.Reader(<'ch_sim', 'en'>)”时,下载了识别模型文件“zh_sim_g2.pth”保存在目录“C:\Users\zhang\.EasyOCR\model”中。
识别结果为“京0T4209”,而实际是“京Q TA209”。把Q错误地识别为0,把A错误地识别为4。也就是说,存在识别错误。而且,没有识别出路面上的汉字。
这里测试了一下,好像EasyOCR不能处理文件名(路径)中的中文。
公益广告牌中文字识别(有识别错误)文件名“D:\temp\pingdeng.png”,图片内容如下:
只有汉字,使用如下命令:
reader = easyocr.Reader(<'ch_sim'>)
result = reader.readtext(r'd:\temp\pingdeng.png', detail = 0, paragraph=True)
result
执行结果如下图所示:
识别结果为:公益广告 平等 众尘乎等 月尊月强
真实文字为:公益广告 平等 众生平等 自尊自强
把“生平”误认作“尘乎”,“自”误认作“月”。也是存在一定的识别错误。
扫描电子书图片中的文字识别(正确率较高)文件名“D:\temp\shu.png”,图片内容如下:
只有汉字,使用如下命令:
reader = easyocr.Reader(<'ch_sim'>)
result = reader.readtext(r'd:\temp\shu.png', detail = 0, paragraph=True)
result
执行结果如下图所示:
识别结果为:排除型字符组是表示所有未列出字符的字符组的简便方祛
真实文字为:排除型字符组是表示所有未列出字符的字符组的简便方法
识别25个字,有一个错误。
小结介绍了EasyOCR的安装,并用其识别了一些图片中的文字。结果显示,EasyOCR具备从图片中检测并识别文字的功能,但存在一定的识别错误率。
相关参考网页http://www.360doc.com/content/22/0125/16/64728681_1014850914.shtml
https://gitee.com/mirrors/EasyOCR/ ( Gitee 极速下载 / EasyOCR)
https://baijiahao.baidu.com/s?id=1729428712024244812&wfr=spider&for=pc
https://blog.csdn.net/family5love/article/details/89362943 (pip3的用法)
https://www.jaided.ai/easyocr/
https://www.jaided.ai/easyocr/install/ 介绍如何安装EasyOCR的网页
pip install easyocr 命令执行的结果Downloading easyocr-1.4.2-py3-none-any.whl (70.8 MB)
---------------------------------------- 70.8/70.8 MB 3.2 MB/s eta 0:00:00
Requirement already satisfied: torchvision>=0.5 in d:\programs\python\python310\lib\site-packages (from easyocr) (0.12.0)
Requirement already satisfied: numpy in d:\programs\python\python310\lib\site-packages (from easyocr) (1.22.4)
Collecting scipy
Downloading scipy-1.8.1-cp310-cp310-win_amd64.whl (36.9 MB)
---------------------------------------- 36.9/36.9 MB 3.7 MB/s eta 0:00:00
Collecting opencv-python-headless<=4.5.4.60
Downloading opencv_python_headless-4.5.4.60-cp310-cp310-win_amd64.whl (35.0 MB)
---------------------------------------- 35.0/35.0 MB 3.3 MB/s eta 0:00:00
Requirement already satisfied: torch in d:\programs\python\python310\lib\site-packages (from easyocr) (1.11.0)
Collecting PyYAML
Downloading PyYAML-6.0-cp310-cp310-win_amd64.whl (151 kB)
---------------------------------------- 151.7/151.7 kB 2.2 MB/s eta 0:00:00
Collecting python-bidi
Downloading python_bidi-0.4.2-py2.py3-none-any.whl (30 kB)
Requirement already satisfied: Pillow in d:\programs\python\python310\lib\site-packages (from easyocr) (9.1.1)
Collecting scikit-image
Downloading scikit_image-0.19.2-cp310-cp310-win_amd64.whl (12.6 MB)
---------------------------------------- 12.6/12.6 MB 3.9 MB/s eta 0:00:00
Requirement already satisfied: typing-extensions in d:\programs\python\python310\lib\site-packages (from torchvision>=0.5->easyocr) (4.2.0)
Requirement already satisfied: requests in d:\programs\python\python310\lib\site-packages (from torchvision>=0.5->easyocr) (2.27.1)
Collecting six
Downloading six-1.16.0-py2.py3-none-any.whl (11 kB)
Collecting imageio>=2.4.1
Downloading imageio-2.19.2-py3-none-any.whl (3.4 MB)
---------------------------------------- 3.4/3.4 MB 4.4 MB/s eta 0:00:00
Collecting PyWavelets>=1.1.1
Downloading PyWavelets-1.3.0-cp310-cp310-win_amd64.whl (4.2 MB)
---------------------------------------- 4.2/4.2 MB 4.0 MB/s eta 0:00:00
Collecting tifffile>=2019.7.26
Downloading tifffile-2022.5.4-py3-none-any.whl (195 kB)
---------------------------------------- 195.6/195.6 kB 3.9 MB/s eta 0:00:00
Requirement already satisfied: packaging>=20.0 in d:\programs\python\python310\lib\site-packages (from scikit-image->easyocr) (21.3)
Collecting networkx>=2.2
Downloading networkx-2.8.2-py3-none-any.whl (2.0 MB)
---------------------------------------- 2.0/2.0 MB 3.9 MB/s eta 0:00:00
Requirement already satisfied: pyparsing!=3.0.5,>=2.0.2 in d:\programs\python\python310\lib\site-packages (from packaging>=20.0->scikit-image->easyocr) (3.0.9)
Requirement already satisfied: certifi>=2017.4.17 in d:\programs\python\python310\lib\site-packages (from requests->torchvision>=0.5->easyocr) (2022.5.18.1)
Requirement already satisfied: urllib3<1.27,>=1.21.1 in d:\programs\python\python310\lib\site-packages (from requests->torchvision>=0.5->easyocr) (1.26.9)
Requirement already satisfied: charset-normalizer~=2.0.0 in d:\programs\python\python310\lib\site-packages (from requests->torchvision>=0.5->easyocr) (2.0.12)
Requirement already satisfied: idna<4,>=2.5 in d:\programs\python\python310\lib\site-packages (from requests->torchvision>=0.5->easyocr) (3.3)
Installing collected packages: tifffile, six, scipy, PyYAML, PyWavelets, opencv-python-headless, networkx, imageio, scikit-image, python-bidi, easyocr
Successfully installed PyWavelets-1.3.0 PyYAML-6.0 easyocr-1.4.2 imageio-2.19.2 networkx-2.8.2 opencv-python-headless-4.5.4.60 python-bidi-0.4.2 scikit-image-0.19.2 scipy-1.8.1 six-1.16.0 tifffile-2022.5.4
PyWavelets:是Python的小波分析库(小波变换)。