在不复制的情况下获取div中的节点

<div class = "conf"> Brazil vs. Colombia </ div> <div class = "targetHour"> 08:00 pm </ div> </ div> </ div> <div class = "matches"> <div class = "conf"> Chilex Argentina </ div> <div class = "targetHour"> 08:00 pm </ div> </ div> </ div>

for nc in soup.find_all('div', attrs={'class': 'league-data'}): campeonato = nc.text for hr in soup.find('div', attrs={'class': 'match row cf'}).findAll("div",recursive=False): print(campeonato + "|" + hr.text)

2条回答

网友

1楼 · 编辑于 2024-09-29 23:20:04

另一种选择（假设列表长度为偶数）

from bs4 import BeautifulSoup

data = '''<div class = "conf">
Brazil vs. Colombia
</div>
<div class = "targetHour"> 08:00 pm </div>
</div>
</div>
<div class = "matches">
<div class = "conf">
Chilex Argentina
</div>
<div class = "targetHour"> 08:00 pm </div>
</div>
</div>'''

soup = BeautifulSoup(data, 'lxml')
items = [item.text.strip() for item in soup.select('.conf, .targetHour')]
for i in range(0, len(items), 2):
       print(items[i],items[i+1])

网友

2楼 · 编辑于 2024-09-29 23:20:04

您可以使用zip()函数将匹配项绑定到相应的计划：

from bs4 import BeautifulSoup

data = '''<div class = "conf">
Brazil vs. Colombia
</div>
<div class = "targetHour"> 08:00 pm </div>
</div>
</div>
<div class = "matches">
<div class = "conf">
Chilex Argentina
</div>
<div class = "targetHour"> 08:00 pm </div>
</div>
</div>'''

soup = BeautifulSoup(data, 'lxml')

for match, hour in zip( soup.select('div.conf'), soup.select('div.targetHour') ):
    print(match.text.strip(), hour.text.strip())

印刷品：

Brazil vs. Colombia 08:00 pm
Chilex Argentina 08:00 pm

相关问题更多 >

编程相关推荐

热门问题

热门文章