我正在建立一个小网站爬虫,我遇到了一些问题。Unicode将是url的第一个字符
假设我有以下网址:http://putlocker.is/actor/Juan_Fern%C3%A1ndez
我的代码是:
try:
connection = urllib.urlopen(self.__link)
get = connection.read().decode('utf8')
except:
if UnicodeDecodeError:
print("UnicodeDecodeError !!!")
我说的是原始链接,不是编码链接
你的错误处理方式似乎是错误的。if语句
UnicodeDecodeError
下的表达式将始终为True。你应该把它改成在你的例子中,任何错误都被吞没了,所以你甚至看不到真正的错误是什么。
相关问题 更多 >
编程相关推荐