如何在python中获取单词后面的数字

3条回答

网友

1楼 · 编辑于 2024-09-21 05:19:13

如果x是静态的，并且总是在每一行的末尾匹配一个子字符串（如"DDD-1126N|refseq:NP_285726|uniprotkb:P00112"），那么re模块在这里是完全不必要的：

x = 'uniprotkb:'
f = open('m.txt')
for line in f:
  if x in line:
    print line[line.find(x)+len(x):]

编辑： 回答你的评论。如果它们由管道字符（|）分隔，则可以执行以下操作：

sep = "|"
x = 'uniprotkb:'
f = open('m.txt')
for line in f:
  if x in line:
    matches = [l[l.find(x)+len(x):] for l in line.split(sep) if l[l.find(x)+len(x):]]
    print matches

如果m.txt有以下行：

DDD-1126N|uniprotkb:285726|uniprotkb:P00112

然后上述将输出：

['285726', 'P00112']

用列分隔符替换sep = "|"。

网友

2楼 · 编辑于 2024-09-21 05:19:13

import re
regex = re.compile('uniprotkb:P([0-9]*)')
print regex.findall(string)

网友

3楼 · 编辑于 2024-09-21 05:19:13

使用正则表达式：

import re
for line in open('m.txt'):
    match = re.search('uniprotkb:P(\d+)', line)
    if match:
        print match.group(1)

相关问题更多 >

编程相关推荐

热门问题

热门文章

如何在python中获取单词后面的数字

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >