使用Beautifulsoup E解析嵌套在Div类中的数据

2024-10-02 12:25:06 发布

您现在位置:Python中文网/ 问答频道 /正文

晚上好,福克斯

我对Python很在行,想通过上研究生院来了解更多。 最近,我了解了一个很棒的插件,它是BeauifulSoup。 我试图解析一个房地产网站“Nestio”的位置数据

据我所知,我做了如下编码

from bs4 import BeautifulSoup
import requests

source = requests.get('https://nestiolistings.com/listings/?listing_type=10&min_price=2500&max_price=3000').text

soup = BeautifulSoup(source, 'lxml')
address = soup.find_all('span', class_ = 'building-title-content')

print(address)

通过“检查”从网站获取的代码为

enter image description here

运行代码后,它只显示“无”

我之所以想不出结果,可能是因为

-信息来自href?还是嵌套太多

我还尝试从第1页到第53页获取信息。 我被告知我需要使用“Json”

import requests
count = 0
for i in range(53):
    count+=1
    link = 'https://nestiolistings.com/listings/?listing_type=10&min_price=2500&max_price=3000&pageNumber='+str(count)
    req = requests.get(link)
    for i in req.json()['building-title-content']:
        address = (i['building-title-content'])
        print ('Address:', address)

所以我也尝试了Json代码,但似乎不管用

有人知道如何解决这个问题吗? 提前欣赏。 我已经为这个问题挣扎了一个月,仍然没有找到解决这个问题的任何线索


Tags: 代码httpsimportsourcegettitle网站address

热门问题