删除Amazon deals页面不返回html代码python

2024-10-03 17:19:33 发布

男 | 程序猿一只，喜欢编程写python代码。

我目前正在尝试使用以下代码来抓取Amazon页面“https://www.amazon.com/b/?ie=UTF8&node=11552285011&ref_=sv_kstore_5”：

from bs4 import BeautifulSoup
import requests
url = 'https://www.amazon.com/b/?ie=UTF8&node=11552285011&ref_=sv_kstore_5'
r = requests.get(url)
soup = BeautifulSoup(r.content)
print(soup.prettify)

但是，当我运行它而不是得到简单的html源代码时，我得到了一堆对我来说没有意义的行，开始如下：

^{pr2}$

即使当我向下滚动时，也没有什么能真正像结构化html代码那样包含我需要的所有信息。我做错什么了？（我是初学者，所以它可以是任何真正的东西）。非常感谢你！在

Tags：代码 https import com ref node url amazon

1条回答

网友

1楼 · 发布于 2024-10-03 17:19:33

print(soup.prettify)

打算呼叫soup.prettify.__repr__()。输出是

^{pr2}$

当您需要调用prettify方法时：

print(soup.prettify())

输出：

<html class="a-no-js" data-19ax5a9jf="dingo">
 <head>
  <script>
   var aPageStart = (new Date()).getTime();
  </script>
  <meta charset="utf-8"/>
  <!   emit CSM JS  >
  <style>
  ...

删除Amazon deals页面不返回html代码python

相关问题更多 >

编程相关推荐

热门问题

热门文章

删除Amazon deals页面不返回html代码python

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >