我使用了下面的代码来读取pdf文件,但它没有读取它。可能是什么原因?
>>> import os
>>> from PyPDF2 import PdfFileReader, PdfFileWriter
>>> path = "/Users/Rahul/Desktop/Dfiles/"
>>> dirs = os.listdir( path )
>>> directory = "/Users/Rahul/Desktop/Dfiles/106_2015_34-76357.pdf"
>>> f = open(directory, 'rb')
>>> reader = PdfFileReader(f)
>>> contents = reader.getPage(0).extractText().split('\n')
>>> f.close()
>>> print contents
输出为[u'],而不是读取内容。
我使用它来逐页迭代pdf,并在其中搜索关键术语并进一步处理。
我想你需要指定磁盘名,它在你的目录中丢失了。例如“D:/Users/Rahul/Desktop/Dfiles/106_2015_34-76357.pdf”。我试过了,我可以毫无问题地阅读。
或者,如果要使用与目录没有真正关联的操作系统模块查找文件路径,可以尝试以下操作:
在Nadia Alramli的答案中可以找到find函数Find a file in python
也许这可以帮助你阅读PDF。
相关问题 更多 >
编程相关推荐