Python要求所有东西都加倍

import requests from bs4 import BeautifulSoup list = ["https://open.spotify.com/user/0n7zzdkxmt0ldpo1kqugwca67", "https://open.spotify.com/user/1l23d3k5yq2v9ey191zp8uqxr", ] for i in list: response = requests.get(i) html_content = response.content soup = BeautifulSoup(html_content, "html.parser") for i in soup.find_all("div",{"class":"bg lazy-image"}): print(i.get("data-src"))

https://i.scdn.co/image/ab6775700000ee85202880a205b627a7e6f25659 https://i.scdn.co/image/ab6775700000ee85202880a205b627a7e6f25659 https://i.scdn.co/image/ab6775700000ee85da40dde3363ed185d5e48a0a https://i.scdn.co/image/ab6775700000ee85da40dde3363ed185d5e48a0a Process finished with exit code 0

3条回答

网友

1楼 · 编辑于 2024-05-03 08:01:15

在这种情况下，只需将iterable转换为集：

    for i in set(soup.find_all("div",{"class":"bg lazy-image"})):
       print(i.get("data-src"))

这样，iterable中的所有重复项都将被删除

我强烈建议大家阅读Python的数据结构：

https://docs.python.org/3/tutorial/datastructures.html

网友
2楼 · 编辑于 2024-05-03 08:01:15

我会将它们转换为一组，以删除重复项：
divs = soup.find_all("div",{"class":"bg lazy-image"}) urls = set(d.get('data-src') for d in divs)

网友
3楼 · 编辑于 2024-05-03 08:01:15

一个简单的解决方案就是检查URL是否等于最后一个URL

import requests
from bs4 import BeautifulSoup


list = ["https://open.spotify.com/user/0n7zzdkxmt0ldpo1kqugwca67",
        "https://open.spotify.com/user/1l23d3k5yq2v9ey191zp8uqxr",
]

for i in list:
    response = requests.get(i)
    html_content = response.content

    url = None
    soup = BeautifulSoup(html_content, "html.parser")
    for i in soup.find_all("div",{"class":"bg lazy-image"}):
        if i.get("data-src") != url:
            url = i.get("data-src")
            print(url)

相关问题更多 >

编程相关推荐

热门问题

热门文章