使用Python将PDF文件作为文本读取

2024-09-27 22:23:39 发布

您现在位置:Python中文网/ 问答频道 /正文

错误

Traceback (most recent call last): File "C:/Users/XXX/pdf_to_text.py", line 7, in module import slate

File "C:\Python27\lib\site-packages\slate__init__.py", line 48, in from slate import PDF File "C:\Python27\lib\site-packages\slate\slate.py", line 3, in module

from pdfminer.pdfparser import PDFParser, PDFDocument

ImportError: cannot import name PDFDocument

代码:

import slate
with open('C:\Users\XXX\XXX.pdf', 'rb') as f:
pdf_text = slate.PDF(f)
print pdf_text

有人能就如何解决这个错误提出建议吗?在

我想用Python读取.PDF文件文本内容。在


Tags: textinpyimportpdflib错误line
1条回答
网友
1楼 · 发布于 2024-09-27 22:23:39

您需要安装正确的pdfminer版本。似乎您拥有的那个没有定义PDFDocument,这就是为什么您得到ImportError。检查slate中的依赖项并获得正确的版本。在

您可以通过

pip list

相关问题 更多 >

    热门问题