我想从字符串的开头删除一组单词。
例如:set = {"aba", "bcd"}
对于字符串"aba bcd aba aba aaa"
,结果应该是"aaa"
,对于字符串"bcd abacaba"
结果应该是"abacaba"
。你知道吗
我试过了
import re
inp = "lalala bababa qqqq n"
pat = re.compile(r"^([la |ba ]+")
print pat.sub("+", inp)
但输出是
+qqqq n
我不明白,为什么它忽略了所有的表情? 什么是正确的regexp?你知道吗
这可能是你想要的:
inp现在是
['lalala','bababa','qqqq','n']
所以把最后一部分
单词
aba
后跟一个或多个空格的正则表达式是'aba +'
。单词
bcd
后跟一个或多个空格的正则表达式是'bcd +'
。其中任何一个的正则表达式都是
'(aba +|bcd +)'
。重复一次或多次是
'(aba +|bcd +)+'
。你知道吗将其替换为空字符串:
强制搜索的字符串位于开头:
相关问题 更多 >
编程相关推荐