得到错误的结果NLTK和REGEX

2条回答

网友

1楼 · 编辑于 2024-10-02 18:27:42

正则表达式匹配意外单词的原因是.修饰符匹配任何字符。如果你想摆脱这一点，你需要限制字符之间的特殊的。在这种情况下，您需要使用一个否定字符类，该类将匹配除元音以外的任何内容。你知道吗

^[^aouie]*a[^aeoui]*e[^aeiou]*i[^aeiou]*o[^aeiou]*u[^aeiou]*$

演示：https://regex101.com/r/Wp2I6H/2

所以现在你可以找到预期的词：

regex = re.compile(r'[^aouie]*a[^aeoui]*e[^aeiou]*i[^aeiou]*o[^aeiou]*u[^aeiou]*')
[w for w in wordlist if regex.match(w)]

请注意，由于您希望在循环中使用regex，因此最好在循环外编译regex，在循环中使用已编译的regex，而不是让python在每次迭代中编译regex。此外，由于regex将完全匹配单词，因此可以使用re.match而不是搜索。你知道吗

网友

2楼 · 编辑于 2024-10-02 18:27:42

试试这个：

import re
wordlist = ['education', 'abstemious', 'automobile', 'facetious', 'regulation', 'novowel', 'afacetiousman', 'aeiou', 'aaeioou', 'aieou']
vowels = ['a','e','i','o','u']
novowel = '[^'+''.join(vowels)+']*'
pattern = ''.join([novowel + v + '{1}' for v in vowels]) + novowel + '$'
print pattern
#[^aeiou]*a{1}[^aeiou]*e{1}[^aeiou]*i{1}[^aeiou]*o{1}[^aeiou]*u{1}[^aeiou]*$    
prog = re.compile(pattern)
print list(filter(lambda w: prog.match(w), wordlist))
# ['abstemious', 'facetious', 'aeiou']

相关问题更多 >

编程相关推荐

热门问题

热门文章

得到错误的结果NLTK和REGEX

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >