利用python3.5.0在windows8上提取Pdf文本 - 问答 - Python中文网

利用python3.5.0在windows8上提取Pdf文本

2024-09-27 22:22:32 发布

您现在位置：Python中文网/ 问答频道 /正文

男 | 程序猿一只，喜欢编程写python代码。

我想用python3.5.0在windows8上的slate包的帮助下从Pdf文件中提取文本。

问题：虽然我已经成功地安装了slate包，但是当我尝试导入slate时，还是有一定的问题错误。请告诉我缺少什么。在

错误：

Traceback (most recent call last): File "", line 1, in import slate File "C:\Users\name\AppData\Local\Programs\Python\Python35-32\lib\site-packages\slate-0.4.1-py3.5.egg\slate__init__.py", line 66, in from slate import PDF
ImportError: cannot import name 'PDF'

Tags：文件 name in 文本 import most pdf 错误

3条回答

网友

1楼 · 编辑于 2024-09-27 22:22:32

slate依赖于PDFMiner（不支持python3）

您可以尝试使用以下方式安装：

pip install PDFMiner

我继续安装pdfminer3k-pypi-但是它没有很好的响应（文档也不好），所以我仔细看了一下，找到了possible alternatives的页面。让我知道如果其中任何一个满意。在

网友

2楼 · 编辑于 2024-09-27 22:22:32

你可以安装六号乘客在

pip install pdfminer.six

https://pypi.python.org/pypi/pdfminer.six/20160614

网友

3楼 · 编辑于 2024-09-27 22:22:32

您可以从poppler库中尝试pdftotext（windows version）。在

作为一个独立的程序，它不需要Python。但我经常将它从Python中用作子进程，如下所示：

import subprocess

args = ['pdftotext', '-layout', '-q', 'input.pdf', '-']
txt = subprocess.check_output(args, universal_newlines=True)

相关问题更多 >

编程相关推荐

热门问题

热门文章