如何使用Beauty Soup删除html注释

2条回答

网友

1楼 · 编辑于 2024-06-28 20:37:38

要搜索表单HTML注释，可以使用bs4.Comment类型：

from bs4 import BeautifulSoup, Comment

html_doc = '''
    <!  t  > <h1>Hejsa</h1> <style>html{color: #0000ff}</style>
'''

soup = BeautifulSoup(html_doc, 'html.parser')

# print comment:
comment = soup.find(text=lambda t: isinstance(t, Comment))
print( comment )

印刷品：

要提取它，请执行以下操作：

comment = soup.find(text=lambda t: isinstance(t, Comment))

# extract comment:
comment.extract()
print(soup.prettify())

印刷品：

<h1>
 Hejsa
</h1>
<style>
 html{color: #0000ff}
</style>

网友

2楼 · 编辑于 2024-06-28 20:37:38

使用正则表达式

import re
html = "<!  t  > <h1>Hejsa</h1> <style>html{color: #0000ff}</style>"
html = re.sub('<! [\s\S]* >', '', html).strip()
print(html)

结果:

<h1>Hejsa</h1> <style>html{color: #0000ff}</style>

编程相关推荐

使用JPT测试jira性能时，java无法识别jiraaddress
java com。fasterxml。杰克逊。数据绑定。JsonMappingException:数值（1557587751202）超出int的范围
war中打包后资源中文件的java FileNotFoundException
java调整JPanel中的JTable大小
java将的ArrayList字符串转换为字符？
web项目中的java我们可以在不了解UI的情况下编写核心服务层吗？
java Android Studio如何从Firebase数据库获取名称的用户日志？
java构建同步映射，在单个键上阻塞
springboot中基于实体camelcase变量nam的java命名存储库方法
java数组行中数字的移动

相关问题更多 >

编程相关推荐

热门问题

热门文章

如何使用Beauty Soup删除html注释

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >