如何忽略一组字符，直到遇到正则表达式中指定的字符？

import re output = 'susa ssh://user@internal.website.ide.company.uk/du33/abo33/ohs231/stk/projects/project1/' url_match = re.match("\s*susa\s+[^(/.+?(?=@)/)]+([^ ]+)", output) Result = re.search("\s*susa\s+[^(/.+?(?=@)/)]+([^ ]+)", output) if Result: print Result.groups() In [29]: runfile('/home/user/Desktop/python_practise/match_urls.py', wdir='/home/user/Desktop/python_practise') ('//user@internal.website.ide.company.uk/du33/abo33/ohs231/stk/projects/project1/',)

1条回答

网友

1楼 · 发布于 2024-09-29 19:24:15

你可以用

r"\s*susa\s[^@]+(\S+)"

详细信息：

\s*-0+空格
susa-a susa子串
\s-a空白
[^@]+-1+除@以外的字符（[^...]是一个negated character class，它匹配除类中指定的字符以外的任何字符）
(\S+)-捕获组1:一个或多个非空白字符。你知道吗

要获取组1中的值，请使用url_match.group(1)。你知道吗

参见Python demo：

import re

output = 'susa ssh://user@internal.website.ide.company.uk/du33/abo33/ohs231/stk/projects/project1/'
url_match = re.match(r"\s*susa\s[^@]+(\S+)", output)
if url_match:
    print(url_match.group(1))
# => @internal.website.ide.company.uk/du33/abo33/ohs231/stk/projects/project1/

Result = re.search(r"\s*susa\s[^@]+(\S+)", output)
if Result:
    print(Result.group(1))
# => @internal.website.ide.company.uk/du33/abo33/ohs231/stk/projects/project1/

相关问题更多 >

编程相关推荐

热门问题

热门文章