如何在不解析内部di的情况下提取外部div内容

2024-09-27 21:26:19 发布

您现在位置:Python中文网/ 问答频道 /正文

我有一个div,比如:

    <div class="info">
                 Illinois
                    <div class="price">
                        $20
                    </div>
    </div>

我想获取“info”div的内容,但是没有“price”div的内容。我使用的是Python和BeutifulSoup。我试图将div内容转换成一个字符串,我可以很容易地过滤它,但是我的代码不起作用:

infosoup = soup.find_all('div', class_="info")
for element in infosoup:
    name = element.string.strip()

谢谢你的帮助。你知道吗


Tags: 字符串代码divinfo内容forelementall
2条回答

您可以使用contents列表:

infosoup = soup.find_all('div', class_="info")
for element in infosoup:
    name = element.contents[0]

最好使用find命令的text=True参数,而不是尝试索引内容列表。你知道吗

matches = [div.find(text=True).strip() for div in soup.find_all('div', class_="info")]

退货:

['Illinois']

相关问题 更多 >

    热门问题