如何使用Regex获得已定义字符串之前的第一个句子

srcset="https://cimg.co/w/articles/1/5ca/f022bb06dc.png 150w, https://cimg.co/w/articles/2/5ca/f022bb06dc.png 300w, https://cimg.co/w/articles/3/5ca/f022bb06dc.png 600w, https://cimg.co/w/articles/4/5ca/f022bb06dc.png 1200w"

3条回答

网友

1楼 · 编辑于 2024-10-01 00:19:57

您可以使用以下正则表达式：

^{}

网友

2楼 · 编辑于 2024-10-01 00:19:57

不需要正则表达式。可以使用字符串方法split和partition执行此操作：

In [181]: srcset = "https://cimg.co/w/articles/1/5ca/f022bb06dc.png 150w, https://cimg.co/w/articles/2/5ca/f022bb06dc.png 300w, https://cimg.co/w/articles/3/5ca/f022bb06dc.png 600w, https://cimg.co/w/arti
     ...: cles/4/5ca/f022bb06dc.png 1200w"                                                                                                                                                                  

In [182]: def get_url(srcset): 
     ...:     for str_ in srcset.split(','): 
     ...:         url, _, ext = str_.strip().partition(' ') 
     ...:         if ext == '1200w': 
     ...:             return url 
     ...:                                                                                                                                                                                                   

In [183]: get_url(srcset)                                                                                                                                                                                   
Out[183]: 'https://cimg.co/w/articles/4/5ca/f022bb06dc.png'

假设,不在url中。你知道吗

如果必须使用Regex，可以执行以下操作：

https?://\S+(?=\s+1200w\b)

所以：

In [184]: re.search(r'https?://\S+(?=\s+1200w\b)', srcset).group()                                                                                                                                          
Out[184]: 'https://cimg.co/w/articles/4/5ca/f022bb06dc.png'

https?://\S+与URL匹配
零宽度的正向lookahead (?=\s+1200w\b)，确保URL后面有一个或多个空格（\s+），然后是1200w

OTOH，如果您对基于HTTP方案的匹配不满意，可以匹配start或,，并获取第一个捕获的组：

In [185]: re.search(r'(?:^|,\s+)(\S+)\s+1200w\b', srcset).group(1)                                                                                                                                          
Out[185]: 'https://cimg.co/w/articles/4/5ca/f022bb06dc.png'

网友

3楼 · 编辑于 2024-10-01 00:19:57

或：

a = 'srcset="https://cimg.co/w/articles/1/5ca/f022bb06dc.png 150w, https://cimg.co/w/articles/2/5ca/f022bb06dc.png 300w, https://cimg.co/w/articles/3/5ca/f022bb06dc.png 600w, https://cimg.co/w/articles/4/5ca/f022bb06dc.png 1200w"'

a = a.replace('srcset=', '').replace('"', '').split(',')
done = a[len(a)-1].strip().split(' ')[0]
print(done)

相关问题更多 >

编程相关推荐

热门问题

热门文章

如何使用Regex获得已定义字符串之前的第一个句子

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >