删除Amazon deals页面不返回html代码python

2024-10-03 17:19:33 发布

您现在位置:Python中文网/ 问答频道 /正文

我目前正在尝试使用以下代码来抓取Amazon页面“https://www.amazon.com/b/?ie=UTF8&node=11552285011&ref_=sv_kstore_5”:

from bs4 import BeautifulSoup
import requests
url = 'https://www.amazon.com/b/?ie=UTF8&node=11552285011&ref_=sv_kstore_5'
r = requests.get(url)
soup = BeautifulSoup(r.content)
print(soup.prettify)

但是,当我运行它而不是得到简单的html源代码时,我得到了一堆对我来说没有意义的行,开始如下:

^{pr2}$

即使当我向下滚动时,也没有什么能真正像结构化html代码那样包含我需要的所有信息。我做错什么了?(我是初学者,所以它可以是任何真正的东西)。非常感谢你!在


Tags: 代码httpsimportcomrefnodeurlamazon
1条回答
网友
1楼 · 发布于 2024-10-03 17:19:33
print(soup.prettify)

打算呼叫soup.prettify.__repr__()。输出是

^{pr2}$

当您需要调用prettify方法时:

print(soup.prettify())

输出:

<html class="a-no-js" data-19ax5a9jf="dingo">
 <head>
  <script>
   var aPageStart = (new Date()).getTime();
  </script>
  <meta charset="utf-8"/>
  <!   emit CSM JS  >
  <style>
  ...

相关问题 更多 >