Python Regex UTF8语法

名称清理测试

import re input = u'CHEZ MADU 東久留米店（シェマディ）【東京都東久留米市】' pattern = re.compile(ur'(【(.*?)\】)', re.UNICODE)\ print(re.sub(input, pattern, ''))

给我这个错误：

它给出了同样的错误。问题的根源是什么？在

2条回答

网友

1楼 · 编辑于 2024-09-28 05:18:52

如果你不使用原始字符串表示法，对我来说效果很好。另外，我认为您没有正确使用re.sub：

re.sub(pattern, repl, string, count=0, flags=0)

这并没有给我带来错误：

import re
input = u'CHEZ MADU 東久留米店（シェマディ）【東京都東久留米市】'
pattern = re.compile(u'(【(.*?)\】)', re.UNICODE)
print(re.sub(pattern, '', input))

这适用于Python2和3，但不需要在3上使用unicode说明符。在

网友

2楼 · 编辑于 2024-09-28 05:18:52

ur'....'语法自python3.3以来无效（请参见http://bugs.python.org/issue15096）

有点奇怪的是，语法错误是在字符串的末尾。。。在

>>> ru'my string'
  File "<stdin>", line 1
    ru'my string'
                ^
SyntaxError: invalid syntax

因此，在Python 3中，可以使用：

名称清理测试