python re.sub，只替换匹配的一部分

网友

1楼 · 编辑于 2024-10-01 12:28:03

可以使用替换组：

>>> my_string = '<cross_sell id="123" sell_type="456"> --> <cross_sell>'
>>> re.sub(r'(\<[A-Za-z0-9_]+)(\s[A-Za-z0-9_="\s]+)', r"\1", my_string)
'<cross_sell> --> <cross_sell>'

注意，我将第一个组（要保留的组）放在括号中，然后在替换字符串中使用"\1"修饰符（第一个组）将其保留在输出中。

网友

2楼 · 编辑于 2024-10-01 12:28:03

因为输入数据是XML，所以最好使用XML解析器来解析它。

内置^{}是一个选项：

>>> import xml.etree.ElementTree as ET
>>> data = '<cross_sell id="123" sell_type="456"></cross_sell>'
>>> cross_sell = ET.fromstring(data)
>>> cross_sell.attrib = {}
>>> ET.tostring(cross_sell)
'<cross_sell />'

^{}是另一个选项。

网友

3楼 · 编辑于 2024-10-01 12:28:03

您可以使用组引用来匹配第一个单词，使用否定字符类来匹配<>之间字符串的其余部分：

>>> s='<cross_sell id="123" sell_type="456">'
>>> re.sub(r'(\w+)[^>]+',r'\1',s)
'<cross_sell>'

\w等于[A-Za-z0-9_]。

相关问题更多 >

编程相关推荐

热门问题

热门文章

python re.sub，只替换匹配的一部分

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >