使用BeautifulSoup和Python删除特定的“dd”标记

kvadratura = float(nek_html.find('span', class_='d-inline-block mt-auto').text.split(' ')[0]) jedinica_mere = nek_html.find('span', class_='d-inline-block mt-auto').text.split(' ')[1].strip() ...

1条回答

网友

1楼 · 发布于 2024-09-28 01:27:03

在这种情况下，您可能希望这样做，而不是使用索引，因为后者可能会导致错误的dd。当您采用以下方法时，您所需要做的就是替换:contains('')中的文本以获得其dd，如Transakcija、Vrsta stana等等

import requests
from bs4 import BeautifulSoup

url = "https://www.nekretnine.rs/stambeni-objekti/stanovi/zemun-krajiska-41m-bela-fasadna-cila-odlican/NkiRX4sq4Cy/"

res = requests.get(url)
soup = BeautifulSoup(res.text,"lxml")
Kategorija = soup.select_one(".base-inf .dl-horozontal:has(:contains('Kategorija:')) > dd")
Kategorija = Kategorija.get_text(strip=True) if Kategorija else ""
print(Kategorija)

编程相关推荐

java如何使用Flyway回滚迁移？
sql试图在java中连接两个表，但我遇到了一个错误
java使用commons apache API复制文件内容
java无法解析模块
原因：java。lang.IllegalArgumentException:org。冬眠QueryException:无法解析属性：
java使用TNT4J，TrackingLogger统计数据仅显示该类的统计数据，如果我想要应用程序范围的统计数据呢？
java项目Euler#19，答案只有在1900年开始时才正确？
java显示标签上的选定值列表
java在局部变量中缓存属性吗？
java preparedStatement。setString（1，“null”）被解释为null而不是字符串（在preparedStatement.addBatch（）之后）

相关问题更多 >

编程相关推荐

热门问题

热门文章

使用BeautifulSoup和Python删除特定的“dd”标记

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >