XPath:访问非属性的内容

2024-06-26 13:50:14 发布

您现在位置:Python中文网/ 问答频道 /正文

我尝试使用lxml和xpath命令从以下代码片段访问时间(07.12.2012 00:36 Uhr)。不幸的是,所希望的信息不是一个属性。我可以使用哪个xpath访问它?你知道吗

我的代码片段:

{'class': 'artikeldiskussion-titel'}
<div class="artikeldiskussion-titel"><span id="posting-649631-titel"><b>So</b></span>

    <span id="an_id" style="position: absolute; visibility: hidden; z-index: 999;"    class="hint_grau">

    </span> <span class="anz-postings-user" title="759 Kommentare">(759)</span> &#183;           07.12.2012 00:36 Uhr
</div>

Tags: 代码命令div信息id属性时间lxml
2条回答

使用text()xpath函数:

txt = tree.xpath('//path/to/span/text()')

这是凌乱的html。你知道吗

在没有看到更多样本的情况下,我建议采用以下两种方法之一:

  1. 抓取div中的最后一个文本节点:/descendant::div[@class="artikeldiskussion-titel"]/child::text()[position()=last()]
  2. 在某个sentinel节点之后抓取文本节点:/descendant::span[@class="anz-postings-user"]/following-sibling::text()[1]

相关问题 更多 >