Python tesseract2dict包_程序模块 - PyPI

从图像中提取文本并将文字级别的输出作为数据帧，以及从给定的边框中提取文本的解决方案

tesseract2dict的Python项目详细描述

第2部分

此类包含两个主要函数：

tess2dict：输入图像并将提取的文本作为一个数据帧，其中给出每个单词的内容、坐标（x、y、w、h）和置信度。本质上，它是pytesseract上输出数据帧的包装器。在
word2text：一旦获得数据帧，就可以通过这个函数和一个边界框一起传递它，以获得给定框内具有适当格式的文本。在

先决条件

美丽之旅4
MakeTreeDir
numpy公司
opencv python
熊猫
肾盂切除术

Tesseract安装

（当前解决方案仅适用于Tesseract 5.0.0）

What is Tesseract?

对于Windows

installation link

添加路径到路径变量（对于Tesseract）

对于Linux

sudo apt install tesseract-ocr
sudo apt install libtesseract-dev

安装

pip install tesseract2dict

用法

我们的解决方案示例如下所示。将图像输入为努比·恩达雷以及提取出来的返回字级别的数据帧。您还可以使用第二个函数以适当格式获取给定边框的纯文本例如：

importcv2fromtesseract2dictimportTessToDicttd=TessToDict()inputImage=cv2.imread('path/to/image.jpg')### function 1word_dict=td.tess2dict(inputImage,'out','outfolder')### function 2text_plain=td.word2text(word_dict,(0,0,inputImage.shape[1],inputImage.shape[0]))

作者

在
Sreekiran A R-分析顾问，人工智能实验室，Bridgei2i分析解决方案- Github， Stackoverflow
在
在
Anil Prasad M N-Bridgei2i Analytics Solutions- Github
在

许可证

这个项目是在MIT许可下授权的-请参阅LICENSE.md文件了解详细信息

注意：此软件依赖于其他软件包，这些软件包可能在不同的开源许可证下获得许可。在

有用链接

http://gwang-cv.github.io/2017/08/25/ubuntu16.04+Tesseract4.0/

欢迎加入QQ群-->： 979659372

tesseract2dict 1.3

tesseract2dict的Python项目详细描述

第2部分

先决条件

Tesseract安装

对于Windows

添加路径到路径变量（对于Tesseract）

对于Linux

安装

用法

作者

许可证

有用链接

推荐PyPI第三方库

pez

gnewcash

PyChess-Anderssen

cinema

Geode-GEM

SenseMe

domaintypesystem

yd

superprompt

secret-miner

gecosistema-gdal

vaud

directory-cms-client

cloudsync

whenIO

导航栏

项目链接

标签

维护者

最新PyPI项目

最新Python常见问题

tesseract2dict 1.3

tesseract2dict的Python项目详细描述

第2部分

先决条件

Tesseract安装

对于Windows

添加路径到路径变量（对于Tesseract）

对于Linux

安装

用法

作者

许可证

有用链接

推荐PyPI第三方库

pez

gnewcash

PyChess-Anderssen

cinema

Geode-GEM

SenseMe

domaintypesystem

yd

superprompt

secret-miner

gecosistema-gdal

vaud

directory-cms-client

cloudsync

whenIO

导 航 栏

项目 链接

标 签

维护者

最新PyPI项目

最新Python常见问题

导航栏

项目链接

标签