使用Python和Beautiful Soup只从页面上的div标记提取文本

<html> <body> <div class="normal" id="foo"> " Many " <a href ='/some link' target = 'blank'>Bollywood</a> " stars today are avowed foodies " <a href = 'link2'>Ranbir Kapoor</a> " Alia Bhat " </div> </body> </html>

1条回答

网友

1楼 · 发布于 2024-09-26 22:45:57

要从beautifulGroup中的某个元素提取text，可以使用.text属性：

>>> t  = """<div class="normal" id="foo">  Many  <a href ='/some link' target = 'blank'>Bollywood</a>  stars today  are avowed foodies  <a href = 'link2'>Ranbir Kapoor</a>  Alia Bhat  </div>"""
>>> bs = BeautifulSoup(t)
>>> print(bs.find('div').text)
  Many  Bollywood  stars today  are avowed foodies  Ranbir Kapoor  Alia Bhat

编程相关推荐

java为什么在ng构建之后使用404？
java Maven原型“quickstart”无法扩展其POM
java Arduino端口卡在满功率状态
java如何确保在参数化构造函数失败时不调用默认构造函数？
java检测Blackberry中的切换失败
java如何将安卓库（作为Angle）链接到Eclipse项目？
java压缩图片，但获取“未知压缩方法”
java无法对应该初始化的模拟实例进行测试
将现有eclipse项目导出到war文件时，java“模块名无效”
java如何防止AppletClassLoader在查找类/其他资源时击中服务器？

相关问题更多 >

编程相关推荐

热门问题

热门文章

使用Python和Beautiful Soup只从页面上的div标记提取文本

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >