印尼笑声的正则表达式模式（WKWK）

网友

1楼 · 编辑于 2024-06-28 15:18:23

>>> s = 'wk wkw wkk kwk kkw wkwk kwkw wkkw kwkk kwkwk wkwkwk wkwoowkwko www k kkk wkwkland'
>>> re.findall(r'\b[wk]*(?:wk|kw)[wk]*\b', s)
['wk', 'wkw', 'wkk', 'kwk', 'kkw', 'wkwk', 'kwkw', 'wkkw', 'kwkk', 'kwkwk', 'wkwkwk']

\b以确保仅匹配整个单词
(?:wk|kw)以确保匹配字中至少有一个kw或wk
- 非捕获组用于避免findall只提供捕获组内匹配的文本
[wk]*以获取其余字符

网友

2楼 · 编辑于 2024-06-28 15:18:23

我使用列表理解来暂时解决这个问题，假设笑词只包含w和k：

[word for word in test_case.split() if (set(word) == set('wk'))]

网友

3楼 · 编辑于 2024-06-28 15:18:23

另一种选择是使用正向前瞻来为其中一个断言，并确保匹配另一个

\b(?=[wk]*w)w*k[wk]*\b

解释

\b字边界
(?=[wk]*w)在右边断言一个w字符
w*k匹配0+次aw，然后确保匹配ak
[wk]*匹配0+次w或k
\b字边界

Regex demo Python demo

比如说

import re

regex = r"\b(?=[wk]*w)w*k[wk]*\b"
test_str = "wk wkw wkk kwk kkw wkwk kwkw wkkw kwkk kwkwk wkwkwk wkwoowkwko www k kkk wkwkland"
print(re.findall(regex, test_str))

输出

['wk', 'wkw', 'wkk', 'kwk', 'kkw', 'wkwk', 'kwkw', 'wkkw', 'kwkk', 'kwkwk', 'wkwkwk']

相关问题更多 >

编程相关推荐

热门问题

热门文章

印尼笑声的正则表达式模式（WKWK）

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >