替换字符串中的段落标记

2024-05-02 11:19:11 发布

您现在位置:Python中文网/ 问答频道 /正文

我有一个html字符串,我正在尝试替换段落标记。我可以通过选择“编辑”>;“查找内容:^p>;“替换为”^s>;“全部替换”来手动执行此操作。我的问题是如何使用python中的html字符串来实现这一点?在

sample_html_string = "<html>
                  <title>
                  Hello
                  </title>
                  </html>"

correct_html_string = "<html><title>Hello</title></html>"

这个问题并不是简单地使用re.sub解决的,因为我有一个更复杂的html字符串,其中包含li标记和{}标记,我希望在其中保持格式。在


Tags: sample字符串标记gtre编辑内容hello
1条回答
网友
1楼 · 发布于 2024-05-02 11:19:11

您可以这样做:

>>> import re
>>> re.sub('\s+', '', sample_html_string)
'<html><title>Hello</title></html>"'

它将替换所有空格字符,并完美地适用于您的示例

如果需要替换段落标记(你是说\n,对吗?)您可以使用内置的replace

^{pr2}$

相关问题 更多 >