Python regex只保留带有文本字符的单词

begin privacy enhanced message proc type 2001 mic clear originator name webmaster www sec gov originator key asymmetric mfgwcgyevqgbaqicaf8dsgawrwjaw2snkk9avtbzyzmr6agjlwyk3xmzv3dtinen twsm7vrzladbmyqaionwg5sdw3p6oam5d3tdezxmm7z1t b twidaqab mic info rsa md5 rsa u6u1hjx9a2vnvegmx3cbhhgtr7o njwodwnjqjg1asldklnjwrulq9hbbcqxoufq ny7xtb92dctfvejdmkdruw 0001393311 11 000011 txt 20110301 0001393311 11 000011 hdr sgml

3条回答

网友

1楼 · 编辑于 2024-10-01 11:38:29

re.match("^[A-Za-z]*$", string):

网友

2楼 · 编辑于 2024-10-01 11:38:29

如果需要提取用非字母分隔的单词，可以使用\b[a-zA-Z]+\bregex（输出Originator和{}from{}）。在

如果你想限制那些最有可能是单词的实体，我建议如下：

(?<![.-])\b([a-z]{2,}|[A-Z]{1}[a-z]+|[A-Z]{2,})\b(?!\.|@|\-)

见here。此正则表达式将限制匹配的数量。在

网友

3楼 · 编辑于 2024-10-01 11:38:29

在这里，您实际上需要使用一个否定的look-behind断言。在

(?<!\S)[A-Za-z]+(?!\S)|(?<!\S)[A-Za-z]+(?=:(?!\S))

(?<!\S)[A-Za-z]+(?!\S)与必须包含字母表的单词完全匹配。
|或
(?<!\S)[A-Za-z]+(?=:(?!\S))一个或多个单词字符，后面必须跟一个冒号，而冒号后面不能跟非空格字符。也可以使用(?=:\s)模式来代替(?=:(?!\S))。

DEMO

相关问题更多 >

编程相关推荐

热门问题

热门文章