XPath选择直到下一个标记

2024-06-26 18:07:11 发布

男 | 程序猿一只，喜欢编程写python代码。

我正在抓取https://en.wikipedia.org/wiki/Gadsden,_Alabama，我想抓取“地理和气候”一段和所有text()元素，直到下一个h2标记出现（即“人口统计”）

我不想在这里抢桌子

到目前为止，我尝试的XPath代码是//span[@id='Geography_and_climate']/following::p，它选择所有内容直到页面结束

我在StackOverflow上尝试了answers的类似问题代码，但对我来说没有任何效果，也许我不是理解他们代码的专家

Tags：代码 text https 标记 org 元素 wiki h2

1条回答

网友

1楼 · 发布于 2024-06-26 18:07:11

尝试使用此XPath选择地理位置之后的所有段落&；气候和人口统计之前

//p[preceding-sibling::h2[1][span[@id='Geography_and_climate']]]