a（嵌套）html标记的正则表达式

2024-09-27 19:18:10 发布

男 | 程序猿一只，喜欢编程写python代码。

我有以下文字：lorem ipsum lorem ipsum 我需要把它分成四组（有规律的表达）：

我想我应该这样做：

但是现在，如果我有Lorem Ipsum，我得到一个['Lorem Ipsum']。我明白为什么，但我不知道如何改进它，因为我需要两个组['Lorem', 'Ipsum']。你有什么想法吗？在

PS：我使用Python和re-module。在

Tags： re 字符空白 class ps 段落 module 文字

1条回答

网友

1楼 · 发布于 2024-09-27 19:18:10

在re .*是贪婪的，这意味着它将尽可能多地匹配文本。添加?使文本不贪婪：

 <p\s.*?>.*?</p\s*?>

以下是文档：

^{pr2}$

可在此处获取文档：