从图像中提取文本并将文字级别的输出作为数据帧,以及从给定的边框中提取文本的解决方案
tesseract2dict的Python项目详细描述
第2部分
此类包含两个主要函数:
- tess2dict:输入图像并将提取的文本作为一个数据帧,其中给出每个单词的内容、坐标(x、y、w、h)和置信度。本质上,它是pytesseract上输出数据帧的包装器。在
- word2text:一旦获得数据帧,就可以通过这个函数和一个边界框一起传递它,以获得给定框内具有适当格式的文本。在
先决条件
- 美丽之旅4
- MakeTreeDir
- numpy公司
- opencv python
- 熊猫
- 肾盂切除术
Tesseract安装
(当前解决方案仅适用于Tesseract 5.0.0)
对于Windows
添加路径到路径变量(对于Tesseract)
对于Linux
sudo apt install tesseract-ocr
sudo apt install libtesseract-dev
安装
pip install tesseract2dict
用法
我们的解决方案示例如下所示。将图像输入为努比·恩达雷以及提取出来的 返回字级别的数据帧。 您还可以使用第二个函数以适当格式获取给定边框的纯文本 例如:
importcv2fromtesseract2dictimportTessToDicttd=TessToDict()inputImage=cv2.imread('path/to/image.jpg')### function 1word_dict=td.tess2dict(inputImage,'out','outfolder')### function 2text_plain=td.word2text(word_dict,(0,0,inputImage.shape[1],inputImage.shape[0]))
作者
- 在
Sreekiran A R-分析顾问,人工智能实验室,Bridgei2i分析解决方案- Github, Stackoverflow
在 - 在
Anil Prasad M N-Bridgei2i Analytics Solutions- Github
在
许可证
这个项目是在MIT许可下授权的-请参阅LICENSE.md文件了解详细信息
注意:此软件依赖于其他软件包,这些软件包可能在不同的开源许可证下获得许可。在
有用链接
- 项目
标签: