Python，正则表达式，方括号内的字符串[]

3条回答

网友

1楼 · 编辑于 2024-09-27 09:22:58

您可以将lines_传递给^{}，并使用如下正则表达式模式：

\[([^\]]+)\]

下面是它所匹配内容的细分：

\[      # [
(       # The start of a capture group
[^\]]+  # One or more characters that are not ]
)       # The close of the capture group
\]      # ]

下面是一个演示：

>>> from re import findall
>>> lines_ = """
... > blabla|blabla|bla|blabla| blabla [Geobacter sp. M21]
... > blabla|blabla|bla|blabla| blabla [Acetobacter pasteurianus IFO 3283-07]
... > blabla|blabla|bla|blabla| blabla [Gardnerella vaginalis ATCC 14019]
... > blabla|blabla|bla|blabla| blabla [Granulibacter bethesdensis CGDNIH1]
... """
>>> findall("\[([^\]]+)\]", lines_)
['Geobacter sp. M21', 'Acetobacter pasteurianus IFO 3283-07', 'Gardnerella vaginalis ATCC 14019', 'Granulibacter bethesdensis CGDNIH1']
>>>

网友

2楼 · 编辑于 2024-09-27 09:22:58

这里不需要正则表达式：

>>> s = '''> blabla|blabla|bla|blabla| blabla [Geobacter sp. M21]
... > blabla|blabla|bla|blabla| blabla [Acetobacter pasteurianus IFO 3283-07]
... > blabla|blabla|bla|blabla| blabla [Gardnerella vaginalis ATCC 14019]
... > blabla|blabla|bla|blabla| blabla [Granulibacter bethesdensis CGDNIH1]'''
>>> for x in s.splitlines():
...     print x.rsplit('[')[-1].rstrip(']')
...     
Geobacter sp. M21
Acetobacter pasteurianus IFO 3283-07
Gardnerella vaginalis ATCC 14019
Granulibacter bethesdensis CGDNIH1

网友

3楼 · 编辑于 2024-09-27 09:22:58

最后我还是这样做了：

for i in list_:
    dop = re.search("\[(.+)\]$", str(i))
    if dop:
        species=dop.group(0)

说明：

\[      # [
(       # start of a capture group
.+      # One or more characters because some of them had brackets inside []
        # like > bla|bla [Salmonella enterica subsp. 4,[5],12:i:- str. 08-1736]
)       # The close of the capture group
\]      # ]
$       # matching from the end of line

谢谢大家的帮助

相关问题更多 >

编程相关推荐

热门问题

热门文章

Python，正则表达式，方括号内的字符串[]

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >