安装用于PDF文本提取的Poppler

2条回答

网友

1楼 · 编辑于 2024-10-03 02:46:16

使用subprocess从xpdf工具调用pdftotext程序。您可以在https://www.xpdfreader.com/download.html找到这些工具的ms windows版本。获取“Xpdf命令行工具”

我这样使用它（python 3.7）：

import subprocess as sp

def pdftotext(path):
    """
    Generate a text rendering of a PDF file in the form of a list of lines.
    """
    args = ['pdftotext', '-layout', path, '-']
    cp = sp.run(
      args, stdout=sp.PIPE, stderr=sp.DEVNULL,
      check=True, text=True
    )
    return cp.stdout

网友

2楼 · 编辑于 2024-10-03 02:46:16

您可以在此处尝试python的poppler:https://pypi.org/project/python-poppler-qt5/

编程相关推荐

在glassfish3服务器上上载应用程序文件（ords.war）时发生java部署错误
java如何更改Elasticsearch上的别名值？
java如何使用Xpath读取更多XSD模式？
java使用jstl在两个jsp之间访问值
java将控制台输出转换为PDF文件
java在循环后没有得到任何结果，几乎完成
java运行的程序无法适应变化
java 安卓 RecyclerView添加新项目将回收移至列表顶部
将字符串转换为日期时的java偏移量
导入包的java问题

相关问题更多 >

编程相关推荐

热门问题

热门文章

安装用于PDF文本提取的Poppler

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >