如何从Python中的长字符串中提取一些字符串？

网友
1楼 · 编辑于 2024-10-01 09:26:51

import re results = re.findall(r'\bhttp://www\.someDomainName\.com/\d+\b', long_string)

网友
2楼 · 编辑于 2024-10-01 09:26:51

是啊，你最简单的赌注就是正则表达式。以下是一些可能完成任务的方法：
import re matcher = re.compile(r'www.(.+).com\/(.+) matches = matcher.search(yourstring) if matches: str1,str2 = matches.groups()

网友
3楼 · 编辑于 2024-10-01 09:26:51

>>> import re
>>> pattern = re.compile("(http://www\\.)(\\w*)(\\.com/)(\\d+)")
>>> matches = pattern.search("http://www.someDomainName.com/2134")
>>> if matches:
        print matches.group(0)
        print matches.group(1)
        print matches.group(2)
        print matches.group(3)
        print matches.group(4)

http://www.someDomainName.com/2134
http://www.
someDomainName
.com/
2134

在上述模式中，我们抓获了5组-

一个是匹配的完整字符串
其余的按括号顺序排列。。（因此，您正在寻找第二个…）(\\w*)

如果需要，可以只捕获感兴趣的string部分。。因此，您可以从您不想要的模式的其余部分移除brackets，并保留(\w*)

>>> pattern = re.compile("http://www\\.(\\w*)\\.com/\\d+")
>>> matches = patter.search("http://www.someDomainName.com/2134")
>>> if matches:
       print matches.group(1) 

someDomainName

在上面的示例中，您将没有groups - 2, 3 and 4，就像在前面的示例中一样，因为我们只捕获了1 group。。是的，总是被捕获。。这是匹配..的完整字符串。。你知道吗

相关问题更多 >

编程相关推荐

热门问题

热门文章