将PDF数据刮入Excel*绝对初学者* - 问答 - Python中文网

将PDF数据刮入Excel绝对初学者

2024-06-26 11:26:58 发布

您现在位置：Python中文网/ 问答频道 /正文

男 | 程序猿一只，喜欢编程写python代码。

对我来说，这就是python的第一天。我曾经用VBA、Java和Swift编写过代码，但我在遵循在线指南编写pdf scraper时遇到了特别困难。因为我不知道我在做什么，所以每次我想测试我在网上找到的一些代码时，我总是碰到一堵墙。在

基本信息

Windows 7 64位
python 3.6.0
Spyder3
我有许多与pdf相关的代码包（PyPDF2、pdfminer、pdfquery、pdfwrw等）

目标

用python创建一些东西，允许我将pdf从文件夹转换成excel文件（理想情况下）或文本文件（我将使用VBA从中进行转换）。在

问题

每次我尝试从网上找到的指南中的一些示例代码时，我总是在调用要测试代码的pdf的行中遇到语法错误。下面是一些指南链接和错误示例。我应该把我的测试.pdf放在与.py文件相同的文件中？在

How to scrape tables in thousands of PDF files?
- 由于最后一行的“for”，我得到了一个无效的语法错误
PDFMiner指南（Link）

runfile('C:/Users/U587208/Desktop/pdffolder/pdfminer.py', wdir='C:/Users/U587208/Desktop/pdffolder') File "C:/Users/U587208/Desktop/pdffolder/pdfminer.py", line 79 print pdf_to_csv('test.pdf', separator, threshold) ^ SyntaxError: invalid syntax

Tags：文件 to 代码 py 示例 pdf 指南 java

3条回答

网友

1楼 · 编辑于 2024-06-26 11:26:58

我正试着做同样的事情！我已经能够将我的pdf转换成文本，但是格式是非常随机和混乱的，我需要表格保持机智，以便能够将它们写入excel数据表。我现在正试图转换成XML，看看它是否更容易从中提取。如果我有任何进展，我会让你知道：）

顺便说一句，如果要使用pdfminer，请使用python2。这里有一些关于pdfminerhttps://media.readthedocs.org/pdf/pdfminer-docs/latest/pdfminer-docs.pdf的帮助

网友

2楼 · 编辑于 2024-06-26 11:26:58

这里 Pdfminer python 3.5一个例子，如何从PDF中提取信息。但它不能解决要导出到Excel的表的问题。商业产品在这方面可能更好。。。在

网友

3楼 · 编辑于 2024-06-26 11:26:58

下面的教程似乎使用了python2。通常很少有明显的区别，最大的区别是在Python3中，打印变成了一种功能，所以

print()

我会建议您更改python的版本或查找python3的教程。希望这有帮助

相关问题更多 >

编程相关推荐

热门问题

热门文章