错误: 在位置上没有要重复的内容

import re test = "fitess" slang_dict = {"fitess":"fitness", "damm":"damn"} slangs_re = re.compile('|'.join(slang_dict.keys())) def correct_slang(s, slang_dict=slang_dict): def replace(match): return slang_dict[match.group(0)] return slangs_re.sub(replace, s) test = correct_slang(test) print(test)

1条回答

网友

1楼 · 发布于 2024-10-03 11:15:25

我建议更换

slangs_re = re.compile('|'.join(slang_dict.keys()))

与

^{pr2}$

并确保按长度按降序排列的键传递。在

from collections import OrderedDict
import re

test = "fitess no kome*"

slang_dict = {"Aha aha":"no", "fitess":"fitness", "damm":"damn", "kome*":"come", "ow wow":"rrf"}
slang_dict = OrderedDict(sorted(slang_dict.iteritems(), key=lambda x: len(x[0]), reverse=True))

slangs_re = re.compile(r"(?<!\w)(?:{})(?!\w)".format('|'.join([re.escape(x) for x in slang_dict])))
def correct_slang(s, slang_dict=slang_dict):
    def replace(match):
        return slang_dict[match.group(0)]

    return slangs_re.sub(replace, s)

test = correct_slang(test)
print(test)

参见Python demo

这将检查单词作为整个单词，并将转义每个搜索短语中的特殊字符，以便在将它们传递给正则表达式引擎时不会出现任何问题。在

如果您对整词匹配不感兴趣，请删除(?<!\w)（检查前导词边界）和{}（检查尾随词边界）。在

相关问题更多 >

编程相关推荐

热门问题

热门文章

错误: 在位置上没有要重复的内容

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >