Python BeautifulSoup无法读取div标记

from bs4 import BeautifulSoup import urllib import re r = urllib.urlopen("http://www.lazada.co.id/catalog/?q=note+2").read() soup = BeautifulSoup(r,"lxml") letters = soup.findAll("span",class_=re.compile("product-card__name")) print type(letters) print letters[0]

1条回答

网友

1楼 · 发布于 2024-09-30 22:16:36

我认为你可能是点击他们的网页太多，在浏览器中浏览，看看网页在你的网络上返回了什么。在

此外，您还可以修改代码，以便检查页面响应头，以确保页面在尝试刮取之前正确返回。我修改了您的代码以显示下面的示例：

from bs4 import BeautifulSoup
import urllib
import re

r = urllib.urlopen("http://www.lazada.co.id/catalog/?q=note+2")
header_code = r.getcode()

if header_code == 200:
    html = r.read()
    soup = BeautifulSoup(html, "lxml")
    letters = soup.findAll("span", {"class" : re.compile("product-card__name")})

    for letter in letters:
        print letter
else:
    print("oops, something went wonky. Page response was: %s"% header_code)

相关问题更多 >

编程相关推荐

热门问题

热门文章

Python BeautifulSoup无法读取div标记

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >