python lxml:如何从具有子元素的元素中获取文本

2024-06-28 20:19:30 发布

您现在位置:Python中文网/ 问答频道 /正文

我想从html代码中提取一些文本,但是下面的代码不支持 eturn sometext,返回“\n”。那么如何得到一些测试呢

a=html.fromstring("""
<p class="clearfix">
<i class="xueli"></i>
sometext
</p>
""")
a.find(".//i").getparent().text

Tags: 代码text文本htmlfindclassfromstringsometext
1条回答
网友
1楼 · 发布于 2024-06-28 20:19:30

使用text_content()方法代替.text

In [5]: a.find(".//i").getparent().text_content().strip()
Out[5]: 'sometext'

或者,您可以访问i元素的以下文本同级

In [6]: a.xpath(".//i/following-sibling::text()")[0].strip()
Out[6]: 'sometext'

相关问题 更多 >