Python中字符串的一些解码问题

#coding=utf-8 try: from urllib.request import Request, urlopen # Python 3 except: from urllib2 import Request, urlopen # Python 2 useragent = 'Mozilla/5.0 (Windows NT 6.3; rv:36.0) Gecko/20100101 Firefox/36.0' #Generate URL url = 'https://www.google.com.tw/search?q=' query = str(input('Google It! :')) full_url = url+query #Request Data data = Request(full_url) data.add_header('User-Agent', useragent) dataRequested = urlopen(data).read() dataRequested = str(dataRequested.decode('utf-8')) print(dataRequested) #Write Data Into File file = open('Google - '+query+'.html', 'w') file.write(dataRequested)

1条回答

网友

1楼 · 发布于 2024-09-23 06:35:54

你的问题是

dataRequested = str(dataRequested.decode('utf-8'))

有理由把解码的UTF-8转换成字符串吗？但这还不是全部。当你从互联网上得到一个字符串时，它应该被解码，但是当你保存这个字符串时，它应该被编码。有些人不明白。它们要么解码要么编码。这样不行。在

我修改了你的代码。我在Python2.7和Python3.4上都很好。在

dataRequested = dataRequested.decode('utf-8')


print(dataRequested)

#Write Data Into File
file = open('Google - '+query+'.html', 'wb')
file.write(dataRequested.encode('utf-8'))

相关问题更多 >

编程相关推荐

热门问题

热门文章