利用python3.5.0在windows8上提取Pdf文本

2024-09-27 22:22:32 发布

您现在位置:Python中文网/ 问答频道 /正文

我想用python3.5.0在windows8上的slate包的帮助下从Pdf文件中提取文本。

问题:虽然我已经成功地安装了slate包,但是当我尝试导入slate时,还是有一定的问题错误。请告诉我缺少什么。在

错误:

Traceback (most recent call last): File "", line 1, in import slate File "C:\Users\name\AppData\Local\Programs\Python\Python35-32\lib\site-packages\slate-0.4.1-py3.5.egg\slate__init__.py", line 66, in from slate import PDF

ImportError: cannot import name 'PDF'


Tags: 文件namein文本importmostpdf错误
3条回答

slate依赖于PDFMiner(不支持python3)

您可以尝试使用以下方式安装:

pip install PDFMiner

我继续安装pdfminer3k-pypi-但是它没有很好的响应(文档也不好),所以我仔细看了一下,找到了possible alternatives的页面。让我知道如果其中任何一个满意。在

你可以安装六号乘客在

pip install pdfminer.six

https://pypi.python.org/pypi/pdfminer.six/20160614

您可以从poppler库中尝试pdftotextwindows version)。在

作为一个独立的程序,它不需要Python。但我经常将它从Python中用作子进程,如下所示:

import subprocess

args = ['pdftotext', '-layout', '-q', 'input.pdf', '-']
txt = subprocess.check_output(args, universal_newlines=True)

相关问题 更多 >

    热门问题