使用Python/Anaconda中的urllib来抓取多个url（循环问题）

from urllib import urlopen as uReq from bs4 import BeautifulSoup as soup my_url = ["https://www.zoopla.co.uk/for-sale/property/birmingham/?q=birmingham&results_sort=newest_listings&search_source=home&page_size=100", "https://www.zoopla.co.uk/for-sale/property/birmingham/?identifier=birmingham&page_size=100&q=birmingham&search_source=home&radius=0&pn=2"] for urls in my_url: uClient = uReq(my_url) page_html = uClient.read() uClient.close() page_soup = soup(page_html,"html.parser") containers = page_soup.findAll("div",{"class":"listing-results-wrapper"}) filename = "links.csv" f = open (filename, "w") headers = "link\n" f.write(headers) for container in containers: link = container.div.div.a["href"] print("link: " + link) f.write(link + "\n") f.close()

1条回答

网友

1楼 · 发布于 2024-10-01 00:26:04

代码被搞乱了，但是列表正在被调用。在

from urllib import urlopen as uReq
from bs4 import BeautifulSoup as soup

my_url = ["https://www.zoopla.co.uk/for-sale/property/birmingham/?q=birmingham&results_sort=newest_listings&search_source=home&page_size=100", "https://www.zoopla.co.uk/for-sale/property/birmingham/?identifier=birmingham&page_size=100&q=birmingham&search_source=home&radius=0&pn=2"]



for urls in my_url:
    uClient = uReq(urls)
    page_html = uClient.read()
    uClient.close()
    page_soup = soup(page_html,"html.parser")
    containers = page_soup.findAll("div",{"class":"listing-results-wrapper"})
    filename = "links.csv"
    f = open (filename, "w")
    headers = "link\n"
    f.write(headers)
    for container in containers:
        link =  container.div.div.a["href"]
        print("link: " + link)
        f.write(link + "\n")
    f.close()

相关问题更多 >

编程相关推荐

热门问题

热门文章