Python请求的响应文本无法分析

2024-09-29 22:19:23 发布

您现在位置:Python中文网/ 问答频道 /正文

我有一个请求,它发送特定的标题和有效负载以获取pdf内容。 在浏览器的“网络”选项卡中,响应如下所示:

enter image description here

但当我使用python请求和beautiful soup模块时,它们都无法解析此响应,也无法将其写入任何文件以正确查看。 以下是我得到的一部分:

//OK[1,["\x3Chtml\x3E\n\x3Chead\x3E\n\x3CMETA http-equiv\x3D\"Content-Type\" content\x3D\"text/html; charset\x3DUTF-8\"\x3E\n\x3Ctitle\x3EДанные ... \x3C/h2\x3E\n\x3C/div\x3E\n\x3C/div\x3E\n\x3C/body\x3E\n\x3C/html\x3E\n"],0,7]

我尝试拆分文本,只保留以html标记开头和结尾的部分,但Beautiful soup无法将十六进制符号替换为普通视图.encode().decode('utf-8')也没有帮助

你推荐什么


Tags: 模块文件网络div标题内容pdfhtml

热门问题