使用beautifulsoup在<br>之间提取文本，但不使用下一个标记

2024-05-21 01:57:43 发布

男 | 程序猿一只，喜欢编程写python代码。

我正在使用python+beautifulsoup来尝试获取br之间的文本。我得到的最接近的结果是以以下方式使用next_sibling：

<html>
<body>
</a><span class="strong">Title1</span>
<p>Text1</p>
<br>The Text I want to get<br>
<p>Text I dont want</p>
</body>
</html>

for span in soup.findAll("span", {"class" : "strong"}):
    print(span.next_sibling.next_sibling.text)

但是这个指纹：

The Text I want to getText I dont want

所以我想要的是在第一个p之后，但是在第二个p之前，但是我不知道如何在没有真正的标记的情况下提取，只有br作为引用。

我需要它来打印：

The Text I want to get

Tags： the to text br get html body class

0条回答

目前没有回答

编程相关推荐

java如何在href中将struts2文本字段的值作为参数传递？
java检查对象属性是否为空的最佳方法是什么？
java通过Maven使用Junit类别运行Cucumber测试
java如何在selenium Webdriver（Mac）中使用Robot类上传多个文件？
如何用python绘制图形或将python转换为java和Matlab？
java Osgi捆绑包更新和ResourceBundle
java使用流api将流<@Nullable T>转换为流<@NonNull T>
java中EXCEL的平台无关连接字符串
JavaFX中的java表
java Jetty线程池和sun。HttpServer会话

使用beautifulsoup在<br>之间提取文本，但不使用下一个标记

相关问题更多 >

编程相关推荐

热门问题

热门文章

使用beautifulsoup在<br>之间提取文本，但不使用下一个标记

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >