我有以下文字:
text_to_transform = "... sistema solar número 90377;[7]\u200b[n. 3]\u200b concretamente ..."
我使用regex替换模式[number]\u200b
和[n. number ]\u200b
。请注意,在本例中,它们一个接一个地发生,但这在数据中不一定是真的
这是我的尝试,但由于某些原因,它没有拿起它
re.sub(r'\[[^)]*\]\\u200b', '', text_to_transform)
Tags:
您需要将零宽度空间与
r'\u200b'
匹配。您的正则表达式正在寻找\
,后跟u200b
子字符串,而不是r'\\u200b'
请参见Python 3演示:
另外,请注意,
\[[^]]*\]
匹配[
,然后是0+字符,而不是]
,然后是]
,而regex匹配[
,然后是0+字符,而不是)
,然后是]
,即它可以跨[
和]
匹配相关问题 更多 >
编程相关推荐