如何将Python爬网的Bing网页内容转换为可读的内容？

2024-09-30 04:30:40 发布

您现在位置：Python中文网/ 问答频道 /正文

9570

网友

男 | 程序猿一只，喜欢编程写python代码。

我在玩用python抓取Bing网页搜索。我发现接收到的原始内容看起来像字节类型，但尝试解压缩失败。有人知道这是什么样的数据吗？我应该如何从这些原始内容中提取可读的数据？谢谢！你知道吗

我的代码显示原始内容，然后尝试执行gunzip，这样您就可以看到原始内容以及解压中的错误。由于原始内容太长，我只是粘贴在下面的前几行。你知道吗

代码：

import urllib.request as Request
import gzip

req = Request.Request('www.bing.com')
req.add_header('upgrade-insecure-requests', 1)
res = Request.urlopen(req).read()
print("RAW Content: %s" %ResPage) # show raw content of web
print("Try decompression:")
print(gzip.decompress(ResPage))   # try decompression

结果：

RAW Content: b'+p\xe70\x0bi{)\xee!\xea\x88\x9c\xd4z\x00Tgb\x8c\x1b\xfa\xe3\xd7\x9f\x7f\x7f\x1d8\xb8\xfeaZ\xb6\xe3z\xbe\'\x7fj\xfd\xff+\x1f\xff\x1a\xbc\xc5N\x00\xab\x00\xa6l\xb2\xc5N\xb2\xdek\xb9V5\x02\t\xd0D \x1d\x92m%\x0c#\xb9>\xfbN\xd7\xa7\x9d\xa5\xa8\x926\xf0\xcc\'\x13\x97\x01/-\x03... ...

Try decompression:
Traceback (most recent call last):
OSError: Not a gzipped file (b'+p')


Process finished with exit code 1

Tags：数据代码 import 内容 raw request content req

1条回答

网友

1楼 · 发布于 2024-09-30 04:30:40

开始使用请求库要容易得多。另外，这也是目前最常用的http请求库。你知道吗

在python环境中安装请求：

pip install requests

在.py文件中：

import requests

r = requests.get("http://www.bing.com")

print(r.text)

如何将Python爬网的Bing网页内容转换为可读的内容？

相关问题更多 >

编程相关推荐

热门问题

热门文章

如何将Python爬网的Bing网页内容转换为可读的内容？

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >