pdf解析器和分析器

yapdfminer的Python项目详细描述


yapdfminer(又一个pdfminer分叉)

pdfminer是一个很好的python工具,它显然已经被它的原始作者抛弃了。 Yusuke Shinyama2016年。 从那以后,它一次又一次地被叉起来,但从来没有被长时间地保持过。

目标

我创建这个fork是为了更好地满足pdf分析中我自己项目的需求:

  1. 应用在原始存储库上的多个请求,即解决了我遇到的一些错误
  2. 目标python 3.7。 不会试图保持与旧版本python的向后兼容性。
  3. 生成一个更小的分发包(我在aws lambda上运行,其中ram是一个高级的)。 代价是放弃对中文、日文和韩文的支持。

如果您需要亚洲语言支持,它应该足够简单,可以通过构建资源来重新启用它 cmaprsrc中的文件。

除了上面提到的问题之外,我还努力使这个库与原来的pdfminer兼容, 例如包括包名(pdfminer3已更改)。

沿袭:

关于

pdfminer是从pdf文档中提取信息的纯python工具。

它的重点是pdf内容的检索和分析。

有关详细信息,请参阅原始回购协议:https://github.com/euske

欢迎加入QQ群-->: 979659372 Python中文网_新手群

推荐PyPI第三方库


热门话题
java GSON在HashSet中添加时使用双舍入   使用ColdFusion 10的自定义Java加载程序时过时的Java类   java在出现空白后,如何区分同一字符串中的不同字符   如果没有initparams,java Servlet容器会创建ServletConfig对象吗?   spring Java 11从8个并行流升级引发ClassNotFoundException   列表中包含可单击组件的java GenericListCellRenderer不工作   java MVVM firebase用户身份验证   java有没有一种简单的方法可以在子活动的操作栏中添加一个按钮?   java如何将这个工作SQL语句转换为JPA CriteriaBuilder?   为什么Java找不到类路径中的类?   java从圆圈开始绘制安卓   java精化会产生JLabel