正在获取上的节点和子节点的文本

2024-10-02 14:26:39 发布

您现在位置:Python中文网/ 问答频道 /正文

我要做的是从一个节点及其子节点获取所有文本,但排除其中一个子节点

下面是HTML:

<blocquote>
  <div class='quote'>
    I don't want to get that.
  </div>

Some text I want to <i> get </i>.

  <div>
    I want to get this.
  </div>
</blockquote>

我已经试过了:

xpath("//blocquote/text()") 但只需要Some text I want to

xpath("//blocquote//text() 但这需要包括I don't want to get that在内的一切

xpath("//blocquote/*[not(div[@class='quote'])]/text() 但不需要Some text I want to

我真的不知道有没有解决办法

谢谢你


Tags: totext文本divget节点thathtml