pythonxpath从具有三个以上相同di的html中提取第一部分html

2024-07-04 13:32:28 发布

您现在位置:Python中文网/ 问答频道 /正文

pythonxpath用于从html中提取div html。例如,如下html所示

    <html>
    <body>
    <div class="main">
    <div class="headline">
    <h2>123</h2>
    </div>
    <div class="headline">
    <h2>abc</h2>
    </div>
    <div id="content">
    <div class="headline">
    <h2>efg</h2>
    </div>
    </div>
    </div>
    </body>
    </html>

我只想为我提取以下part div html或提取123文本:

    <div class="headline">
    <h2>123</h2>
    </div>

我的代码如下所示:

  title = tree.xpath('//div[contains(@class, "headline")]/h2')

但是我得到了所有三个html数据。实际上,我只想得到123数据html部分。请使用xpath方法。谢谢


Tags: 数据dividmainhtmlbodyh2content
1条回答
网友
1楼 · 发布于 2024-07-04 13:32:28

如果你想得到这个零件:

<div class="headline">
<h2>123</h2>
</div>

使用此Xpath:

(//div[contains(@class, "headline")])[1]

xpath返回了匹配元素的列表,()[1]部分返回该列表上的第一项

相关问题 更多 >

    热门问题