多次匹配括号内的文本

3条回答

网友

1楼 · 编辑于 2024-09-27 09:30:15

为什么需要<p>标记

import re

source = '<p>Joe likes <ul><li>pizza</li>, <li>burgers</li>, and <li>fries</li></ul></p>'

m = re.findall('(<li>.+?</li>)',source)
print m

我想要你想要的

编辑

如果您只需要在<p>标记之间的文本，可以通过两个步骤完成：

import re

source = '<p>Joe likes <ul><li>pizza</li>, <li>burgers</li>, and <li>fries</li></ul></p> and also <li>coke</li>'

ss = re.findall('<p>(.+?)</p>',source)

for s in ss:
    m = re.findall('(<li>.+?</li>)',s)
    print m

网友
2楼 · 编辑于 2024-09-27 09:30:15

这应该起作用：
import re source = '<p>Joe likes <ul><li>pizza</li>, <li>burgers</li>, and <li>fries</li></ul></p>' res = ''.join(re.findall('<li>[^<]*</li>', source)) # <li>pizza</li><li>burgers</li><li>fries</li>

网友
3楼 · 编辑于 2024-09-27 09:30:15

假设您已经提取了示例字符串，您可以执行以下操作：

import re
s = "<p>Joe likes <ul><li>pizza</li>, <li>burgers</li>, and <li>fries</li></ul></p>"
re.findall("<li>.+?</li>", s)

Output:
['<li>pizza</li>', '<li>burgers</li>', '<li>fries</li>']

相关问题更多 >

编程相关推荐

热门问题

热门文章

多次匹配括号内的文本

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >