从httplib GET解码内容

import codecs import httplib # nothing unusual conn = httplib.HTTPConnection('server') conn.request('GET', '/') response = conn.getresponse() content = response.read() # the painful part sr = codecs.getreader("cp1250")(content) lines = sr.readlines() # d'oh!

2条回答

网友

1楼 · 编辑于 2024-09-29 19:35:46

根据http://docs.python.org/2/library/codecs.html，getreader()返回StreamReader。它必须传递一个流，它实现了read()函数，而不是像您所做的那样，一个字符串。在

要解决这个问题，不要从response读取数据，而是直接将其传递给StreamReader，如下所示。在

conn = httplib.HTTPConnection('server')
conn.request('GET', '/')
response = conn.getresponse()

reader = codecs.getreader("cp1250")(response)
lines = sr.readlines()

网友

2楼 · 编辑于 2024-09-29 19:35:46

utf8_lines = []
for line in content.split('\n'):
   line = line.strip().decode('cp1250')
   utf8_lines.append(line.encode('utf-8'))

相关问题更多 >

编程相关推荐

热门问题

热门文章

从httplib GET解码内容

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >