XPath选择直到下一个标记

2024-06-26 18:07:11 发布

您现在位置:Python中文网/ 问答频道 /正文

我正在抓取https://en.wikipedia.org/wiki/Gadsden,_Alabama,我想抓取“地理和气候”一段和所有text()元素,直到下一个h2标记出现(即“人口统计”)

我不想在这里抢桌子

到目前为止,我尝试的XPath代码是//span[@id='Geography_and_climate']/following::p,它选择所有内容直到页面结束

我在StackOverflow上尝试了answers的类似问题代码,但对我来说没有任何效果,也许我不是理解他们代码的专家


Tags: 代码texthttps标记org元素wikih2
1条回答
网友
1楼 · 发布于 2024-06-26 18:07:11

尝试使用此XPath选择地理位置之后的所有段落&;气候和人口统计之前

//p[preceding-sibling::h2[1][span[@id='Geography_and_climate']]]

相关问题 更多 >