我有一些PDF需要从中提取信息。我在centos7上使用python和python的lib slate。 一开始,石板很好用。但是我必须更新几个模块和lib。slate lib不再工作了。 为了解决这个问题,我尝试更新slate,并尝试使用不同的版本,但没有一个工作。 错误是:
File "/usr/lib64/python2.7/StringIO.py", line 271, in getvalue
self.buf += ''.join(self.buflist)
UnicodeDecodeError: 'ascii' codec can't decode byte 0xc3 in position 58: ordinal not in range(128)`
当我把我的代码去掉时,一切都很好。你知道吗
我使用slate的代码:
def adequacaoCut(pdf, person, pathInt, pathImg):
with open('pdfs/'+pdf, 'rb') as f:
doc = slate.PDF(f)
print doc
... rest of code that works fine
slate版本:0.5.2
的版本python:2.7版
随着时间的流逝,我再也记不起在python、centos或我做过的任何事情上有哪些lib或更新了。 我该怎么办?你知道吗
我自己解决这个问题。我发现我的电脑里有两个pdfminer(pdfminer和pdfminer.6号). 我认为图书馆之间有某种冲突,或者斯莱特试图打电话给我pdfminer.6号而不是pdfminer。 我卸载两者并只重新安装pdfminer。它现在很有魅力。你知道吗
相关问题 更多 >
编程相关推荐