如何在靓汤中找到特定的div文本

2024-09-29 18:59:16 发布

您现在位置:Python中文网/ 问答频道 /正文

我有以下html:

from bs4 import BeautifulSoup as soup
html_doc = """<div class="__cast-member" content="Vishal Krishna Reddy" itemprop="name"><div class="__cast-image wow fadeIn"><meta content="https://in.bmscdn.com/iedb/artist/images/website/poster/large/vishal-krishna-reddy-16275-24-03-2017-15-17-54.jpg" itemprop="image"><img alt="Vishal Krishna Reddy" data-error="//in.bmscdn.com/webin/profile/user.jpg" data-lazy="//in.bmscdn.com/iedb/artist/images/website/poster/large/vishal-krishna-reddy-16275-24-03-2017-15-17-54.jpg" title="Vishal Krishna Reddy"/></meta></div><br/>Developer<br><span class="__role">Actor</span><br><span class="__characterName">As Kathiravan</span></br></br></div>"""
html = soup(html_doc, "html.parser")
Cast=html.find("div", {"class":"__cast-member"})
print Cast.text

输出:developeratoras Kathiravan

但我只需要输出:开发者


Tags: inbrdivcomdochtmlclassjpg
1条回答
网友
1楼 · 发布于 2024-09-29 18:59:16

您可以使用^{}属性来获取所需的文本。首先找到带有class="__cast-image wow fadeIn"<div>标记。您需要的文本位于此标记之后。所以,在这个标记上使用.next_sibling。但首先您将得到<br/>,所以请再次使用它。在

>>> soup.find('div', class_='__cast-image').next_sibling
<br/>
>>> soup.find('div', class_='__cast-image').next_sibling.next_sibling
'Developer'

相关问题 更多 >

    热门问题