Python请求后编码

import urllib import urllib2 url = 'http://donelaitis.vdu.lt/main_helper.php?id=4&nr=1_2_11' data = 'q=bus&ieskoti=true&lang1=en&lang2=en+-%3E+lt+%28+71813+lygiagre%C4%8Di%C5%B3+sakini%C5%B3+%29&lentele=vertikalus&reg=false&rodyti=dalis&rusiuoti=freq' req = urllib2.Request(url, data) response = urllib2.urlopen(req) the_page = response.read() file = open("pagesource.txt", "w") file.write(the_page) file.close()

2条回答

网友

1楼 · 编辑于 2024-06-01 06:44:37

为什么不尝试thepage = the_page.decode('utf-8')而不是encode，因为您想要的是从utf-8编码的文本移动到unicode编码的不可知的内部字符串？

网友

2楼 · 编辑于 2024-06-01 06:44:37

两件事。首先，您不想对响应进行编码，而是要对其进行解码：

thepage = the_page.decode('utf-8')

其次，您不想在响应上设置头，而是在请求上设置头，使用add_header方法：

req.add_header('Content-Type', 'text/html;charset=utf-8')

编程相关推荐

java如何通过解决错误“活动无法转换为片段”将片段传递给类构造函数？
Java中清理Code39条码数据的regex帮助
将java转换为C++
java无法在Android Studio中生成签名的apk，出现错误
从数学方程出发
MySQL和Java内存问题
如何强制Java抛出算术异常？
java为什么JDBC将零端口视为空（默认）端口？
java如何在没有“changelog主题”的情况下加入KStream和KTable
排序我尝试合并两个排序的数组，但得到的是java。lang.ArrayIndexOutofBounds异常：5无法找出原因

相关问题更多 >

编程相关推荐

热门问题

热门文章