用于排除某些单词，同时匹配其他单词的正则表达式

"...milk..." => matched ['milk'] "...almondmilk..." = no match "...almond milk..." = no match "...almond word(s) milk..." => matched ['milk'] "...almondword(s)milk..." => matched ['milk'] "...soymilk..." = no match "...soy milk..." = no match "...soy word(s) milk..." => matched ['milk'] "...soyword(s)milk..." => matched ['milk']

>>> food = "is combined with creamy soy and milk. a fruity and refreshing sip of spring, " >>> re.findall(regx, food) [] >>> food = "is combined with creamy milk. a fruity and refreshing sip of spring, " >>> re.findall(regx, food) [('', 'milk')]

2条回答

网友

1楼 · 编辑于 2024-06-26 00:19:18

This regex对我有用

(?:soy|almond)\s?[\w\(\)]+\s?(milk)

或不接受以下词语中的括号：

(?:soy|almond)\s?\w+\s?(milk)

在Python中，应该是这样的：

import re

matches = re.findall(r'(?:soy|almond)\s?[\w\(\)]+\s?(milk)', your_text)

网友

2楼 · 编辑于 2024-06-26 00:19:18

您可以通过匹配来排除soymilk{}杏仁奶and杏仁奶`并在捕获组中仅捕获牛奶，该组将由re.findall返回

\b(?:soy|almond)\s?milk\b|\b(milk)\b

模式匹配：

\b防止部分匹配的单词边界
(?:soy|almond)匹配大豆或杏仁
\s?milk\b匹配可选的空格char和milk，后跟单词边界
|或
\b(milk)\b在组1中捕获被单词边界包围的牛奶

您还可以使用[^\S\r\n]而不是\s来匹配没有换行符的空格，因为后者可以匹配换行符

Regex demo Python demo

比如说

import re

regx = r"\b(?:soy|almond)\s?milk\b|\b(milk)\b"

food = "is combined with creamy soy and milk. a fruity and refreshing sip of spring, "
print(re.findall(regx, food))

food = "is combined with creamy milk. a fruity and refreshing sip of spring, "
print(re.findall(regx, food))

输出

['milk']
['milk']

另一种选择是使用PyPi regex module

(?<!\b(?:soy|almond)\s*(?:milk)?)\bmilk\b

模式匹配：

(?<!负向后看，断言直接在左边的不是
\b(?:soy|almond)单词边界，匹配大豆或杏仁
\s*(?:milk)?匹配可选的空格字符，然后选择milk
)近距离观察
\bmilk\b在单词边界之间匹配milk

Regex demo Python demo

相关问题更多 >

编程相关推荐

热门问题

热门文章