使用请求解析Amazon上的产品标题

<div class="p13n-sc-truncate p13n-sc-line-clamp-2" aria-hidden="true" data-rows="2"> Fingerlings Light Up Unicorn - Mackenzie (White) - Friendly Interactive Toy by WowWee </div> ........ omitted code here.......... <div class="p13n-sc-truncate p13n-sc-line-clamp-2" aria-hidden="true" data-rows="2"> Rocketbook Everlast Reusable Smart Notebook, Executive Size </div>

1条回答

网友

1楼 · 发布于 2024-09-30 10:31:31

对，这个类对于这个页面来说有点太泛化了。你能做的是首先确定畅销商品所在的集装箱。例如，可以是：

soup.select("ol#zg-ordered-list > li")

现在，您只能在物品容器内操作，这会严重缩小范围：

for product in soup.select("ol#zg-ordered-list > li"):
    product_name = product.select_one(".p13n-sc-truncated").get_text()
    print(product_name)

或者，您可以从产品图像的alt属性中获取产品标题：

for product in soup.select("ol#zg-ordered-list > li"):
    product_name = product.select_one("img[alt]")["alt"]
    print(product_name)

相关问题更多 >

编程相关推荐

热门问题

热门文章