Python：美丽的归来行李袋

2条回答

网友

1楼 · 编辑于 2024-09-30 16:25:31

urlopen似乎存在编码问题，requests工作正常：

x = requests.get("http://bato.to/comic/_/comics/rakudai-kishi-no-eiyuutan-r11615")
y = BeautifulSoup(x.content)    
print y


<!DOCTYPE html>
<html lang="en" xmlns:fb="http://www.facebook.com/2008/fbml">
<head>
<meta charset="utf-8"/>
<title>Rakudai Kishi no Eiyuutan - Scanlations - Comic - Comic Directory - Batoto -    Batoto</title>
.................

使用urlopen可以得到以下结果：

^{pr2}$

因此，正如您所见，这是urlopen而不是{}的问题。在

网友

2楼 · 编辑于 2024-09-30 16:25:31

服务器正在返回gzip字节。因此，要使用urllib2下载内容：

import sys
import urllib2
import gzip
import io
url = "http://bato.to/comic/_/comics/rakudai-kishi-no-eiyuutan-r11615"
response = urllib2.urlopen(url)

# print(response.headers)
content = response.read()
if response.headers['Content-Encoding'] == 'gzip':
    g = gzip.GzipFile(fileobj=io.BytesIO(content))
    content = g.read()

encoding = response.info().getparam('charset')
content = content.decode(encoding)

这将检查内容是否与requests返回的page.text相同：

^{pr2}$

{{3>强烈建议使用cd3}和更强大的处理能力。在

相关问题更多 >

编程相关推荐

热门问题

热门文章

Python：美丽的归来行李袋

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >