从图像中提取文本并将文字级别的输出作为数据帧,以及从给定的边框中提取文本的解决方案

tesseract2dict的Python项目详细描述


第2部分

此类包含两个主要函数:

  1. tess2dict:输入图像并将提取的文本作为一个数据帧,其中给出每个单词的内容、坐标(x、y、w、h)和置信度。本质上,它是pytesseract上输出数据帧的包装器。在
  2. word2text:一旦获得数据帧,就可以通过这个函数和一个边界框一起传递它,以获得给定框内具有适当格式的文本。在

先决条件

  • 美丽之旅4
  • MakeTreeDir
  • numpy公司
  • opencv python
  • 熊猫
  • 肾盂切除术

Tesseract安装

(当前解决方案仅适用于Tesseract 5.0.0)

What is Tesseract?

对于Windows

添加路径到路径变量(对于Tesseract)

对于Linux

  • sudo apt install tesseract-ocr
  • sudo apt install libtesseract-dev

安装

pip install tesseract2dict

用法

我们的解决方案示例如下所示。将图像输入为努比·恩达雷以及提取出来的 返回字级别的数据帧。 您还可以使用第二个函数以适当格式获取给定边框的纯文本 例如:

importcv2fromtesseract2dictimportTessToDicttd=TessToDict()inputImage=cv2.imread('path/to/image.jpg')### function 1word_dict=td.tess2dict(inputImage,'out','outfolder')### function 2text_plain=td.word2text(word_dict,(0,0,inputImage.shape[1],inputImage.shape[0]))

作者

  • Sreekiran A R-分析顾问,人工智能实验室,Bridgei2i分析解决方案- GithubStackoverflow

  • Anil Prasad M N-Bridgei2i Analytics Solutions- Github

许可证

这个项目是在MIT许可下授权的-请参阅LICENSE.md文件了解详细信息

注意:此软件依赖于其他软件包,这些软件包可能在不同的开源许可证下获得许可。在

有用链接

  1. http://gwang-cv.github.io/2017/08/25/ubuntu16.04+Tesseract4.0/

欢迎加入QQ群-->: 979659372 Python中文网_新手群

推荐PyPI第三方库


热门话题
关于持久性框架的java查询   java My JComponents占用了太多像素   来自保存结构化JSON对象的java错误请求   java一个面板上的鼠标侦听器如何使用另一个面板上对象的值?   java openGL在psuedo3d透视图中绘制扭曲的精灵(图像)   java更改行跨度   java如何在NatTable单元格中插入两个文本(每个文本具有不同的字体)和一个图像?设定利润率?   Objective和Java、iPhone和Android之间有什么巨大的区别吗?   JavaVLCJ在eclipse中播放rtsp流视频,但不是在制作可执行JAR之后   java如何访问原始图像数据   java如何检查未扩展的Ant属性   安卓如何从中获取文本视图。xml到Java文件   java Hibernate仅检索一列,另一列为null   使用java更新json对象   Android中带有networksecurityconfig的java SSL固定   面向对象Java对象拆卸模式   刷新期间java阻止对HashMap的访问   数组BufferedReader和流行Java 8