如何用python解码从网站中提取的pfd文件?

2024-10-03 13:22:45 发布

您现在位置:Python中文网/ 问答频道 /正文

这是密码

#!/usr/bin/python
import codecs
import urllib.request
resp = urllib.request.urlretrieve('http://normanpd.normanok.gov/filebrowser_download/657/2017-02-16%20Daily%20Incident%20Summary.pdf', 'test.pdf')
with codecs.open("test.pdf") as f:
     for line in f:
         line.decode('utf-8')

         print(line)

在执行上述代码之后,我得到如下错误

Traceback (most recent call last):
  File "normanpd.py", line 6, in <module>
    for line in f:
  File "/usr/lib/python3.5/codecs.py", line 321, in decode
    (result, consumed) = self._buffer_decode(data, self.errors, final)
UnicodeDecodeError: 'utf-8' codec can't decode byte 0xb5 in position 11: invalid start byte

请帮我解决这个问题。你知道吗


Tags: inpytestimportforpdfrequestusr
1条回答
网友
1楼 · 发布于 2024-10-03 13:22:45

是什么让你认为这个文件是一个编码的字符串?它根本不是字符串;pdf是不可读的,它是二进制格式。你不能只是反复浏览并打印出来。你知道吗

相关问题 更多 >