通过正则表达式拆分字符串

网友

1楼 · 编辑于 2024-10-05 12:16:44

删除^和$锚定，因为它们只匹配字符串的开头和结尾。因为电子邮件地址在字符串的中间，所以它们永远不会匹配。你知道吗

你的regexp还有其他问题。帐户名可以包含许多其他字符，例如_和-。域名可以包含-个字符，但不能包含+。而且您不应该使用范围A-z来获取大写和小写字符，因为在两个字母块之间有您可能不想包含的字符（请参见ASCII Table）；或者使用A-Za-z或者使用a-z并添加flags = re.IGNORECASE。你知道吗

网友

2楼 · 编辑于 2024-10-05 12:16:44

您可能需要遍历这些行，然后用regex拆分每一行。另外，regex的末尾不应该有$。你知道吗

尝试以下操作：

EMAIL_REGEX = r"\.[a-z]{3} " # just for the demo note the space
ends =[]
for L in input.split("\n"):
   parts = re.split(EMAIL_REGEX,L)
   if len(parts) > 1:
       ends.append(parts[1])

输出：

['is a very nice person', 'sucks', 'is pretty funny.']

网友

3楼 · 编辑于 2024-10-05 12:16:44

'^$'可能会把它扔掉。它只匹配以匹配正则表达式开头和结尾的字符串。你知道吗

我有你想要的东西：

>>> EMAIL_REGEX = r'[A-Z0-9._%+-]+@[A-Z0-9.-]+\.[A-Z]{2,4}'
>>> re.split(EMAIL_REGEX, input, flags=re.IGNORECASE)
['\n', ' is a very nice person\n', ' sucks\n', ' is pretty funny.']

相关问题更多 >

编程相关推荐

热门问题

热门文章

通过正则表达式拆分字符串

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >