基于pdfminer2的pdf文本转换
pdf2textbox的Python项目详细描述
docs | |
---|---|
tests | |
package | |
license |
PDF2文本框
基于pdfminer2(基于 pdfminer.6,它基于pdfminer)。 转换最多包含3列和一个标题的PDF文件(可选) 编写文本并避免多列pdf文件具有的大多数警告 存储以进行PDF转换。
功能
按原始顺序将PDF转换为文本。这对pdf文件很有用 没有表格,图表和其他东西。
允许命令行参数-s(–slice)指示 pdf文档很有趣。起始页和结束页将是 使用“”或“”作为分隔符从文档名称检索,或- 如果找不到起始页和结束页-则请求用户输入。
安装
pip install pdf2textbox
支持
请随意叉叉和改进。
保修
兹免费准许任何人取得副本 本软件和相关文档文件(“软件”)的 在软件中不受限制,包括但不限于 使用、复制、修改、合并、发布、分发、再授权和/或出售 软件的副本,并允许软件的用户 在满足以下条件的情况下,可以这样做:
上述版权公告及本许可公告须包括在 软件的拷贝或大部分。
本软件按“原样”提供,无任何形式的保证,明示或 默示的,包括但不限于适销性保证, 适合特定用途、所有权和非侵权行为。无论如何 版权所有人或任何分发本软件的人对任何 损害赔偿或其他责任,不论是合同、侵权行为或其他原因引起的 来自、脱离或与软件、使用或其他交易有关 在软件里。
许可证
麻省理工学院许可证
版权所有(c)2018 Oliver Stapel