擅长:python、mysql、java
<p>我正试着做同样的事情!我已经能够将我的pdf转换成文本,但是格式是非常随机和混乱的,我需要表格保持机智,以便能够将它们写入excel数据表。我现在正试图转换成XML,看看它是否更容易从中提取。如果我有任何进展,我会让你知道:)</p>
<p>顺便说一句,如果要使用pdfminer,请使用python2。这里有一些关于pdfminer<a href="https://media.readthedocs.org/pdf/pdfminer-docs/latest/pdfminer-docs.pdf" rel="nofollow noreferrer">https://media.readthedocs.org/pdf/pdfminer-docs/latest/pdfminer-docs.pdf</a>的帮助</p>