排成这样: (bla-表示不重要)
> blabla|blabla|bla|blabla| blabla [Geobacter sp. M21]
> blabla|blabla|bla|blabla| blabla [Acetobacter pasteurianus IFO 3283-07]
> blabla|blabla|bla|blabla| blabla [Gardnerella vaginalis ATCC 14019]
> blabla|blabla|bla|blabla| blabla [Granulibacter bethesdensis CGDNIH1]
我试着把所有的信息放在括号里[] 作为:
Geobacter sp. M21
Acetobacter pasteurianus IFO 3283-07
Gardnerella vaginalis ATCC 14019
Granulibacter bethesdensis CGDNIH1
我的代码在这里,当然它不工作-在[]中有时是3,有时是4个“alfanumeric单词”,还有像“.”这样的字符或“-”:
import re
#code...
pattern = r'[ \w+ \w+ \w+ ]'
for i in lines_:
m = re.search ( pattern, str(i) )
print m.group()
那么,是否可以使用正则表达式获取这些信息呢?你知道吗
您可以将} ,并使用如下正则表达式模式:
lines_
传递给^{下面是它所匹配内容的细分:
下面是一个演示:
这里不需要正则表达式:
最后我还是这样做了:
说明:
谢谢大家的帮助
相关问题 更多 >
编程相关推荐