基于pdfminer2的pdf文本转换

pdf2textbox的Python项目详细描述


docsDocumentation Status
tests
Travis-CI Build Status
package
PyPI Package latest releaseSupported versionsSupported implementations
license
CocoaPods

PDF2文本框

基于pdfminer2(基于 pdfminer.6,它基于pdfminer)。 转换最多包含3列和一个标题的PDF文件(可选) 编写文本并避免多列pdf文件具有的大多数警告 存储以进行PDF转换。

功能

按原始顺序将PDF转换为文本。这对pdf文件很有用 没有表格,图表和其他东西。

允许命令行参数-s(–slice)指示 pdf文档很有趣。起始页和结束页将是 使用“”或“”作为分隔符从文档名称检索,或- 如果找不到起始页和结束页-则请求用户输入。

安装

pip install pdf2textbox

支持

请随意叉叉和改进。

保修

兹免费准许任何人取得副本 本软件和相关文档文件(“软件”)的 在软件中不受限制,包括但不限于 使用、复制、修改、合并、发布、分发、再授权和/或出售 软件的副本,并允许软件的用户 在满足以下条件的情况下,可以这样做:

上述版权公告及本许可公告须包括在 软件的拷贝或大部分。

本软件按“原样”提供,无任何形式的保证,明示或 默示的,包括但不限于适销性保证, 适合特定用途、所有权和非侵权行为。无论如何 版权所有人或任何分发本软件的人对任何 损害赔偿或其他责任,不论是合同、侵权行为或其他原因引起的 来自、脱离或与软件、使用或其他交易有关 在软件里。

许可证

麻省理工学院许可证

版权所有(c)2018 Oliver Stapel

欢迎加入QQ群-->: 979659372 Python中文网_新手群

推荐PyPI第三方库


热门话题
java GWT对话框从不显示帮助   java在简单的MapReduce作业中带来了极大的开销   javacom。mysql。jdbc。例外情况。jdbc4。MySQLIntegrityConstraintViolationException:列不能为null/onetoone映射   如何通过TCP/IP与Java和Labview进行通信,并发送浮点数据缓冲区?   java Apache camel与spring事件基本示例   java如何使我的秒表应用程序在完全关闭后仍能运行?   java Nutch爬网错误输入路径不存在   java是Mapreduce中按值传递还是按引用传递的键?   正则表达式替换java中的特定字符   Java DOM XML解析   java Eclipse未显示服务器的项目   使用Arraylist进行快速排序的排序Java实现疑难解答   java Split text包含字符串列表中的数字   检查Java中的两个lambda是否执行相同的代码?   java为什么dispatchTouchEvent避免在屏幕上单击?