如何删除结尾有不同数字的字符串

import os import re f2 = open(r'path') num = 0 while num < 200: num = num+1 ident2 = re.compile('SRR.*?%d' %num, re.DOTALL) stuff = f2.read() for line in f2: ident2.sub('',stuff)

@SRR566546.970 HWUSI-EAS1673_11067_FC7070M:4:1:2299:1109 length=50TTGCCTGCCTATCATTTTAGTGCCTGTGAGGTGGAGATGTGAGGATCAGT+SRR566546.970 HWUSI-EAS1673_11067_FC7070M:4:1:2299:1109 length=50hhhhhhhhhhghhghhhhhfhhhhhfffffe`ee[`X]b[d[ed`[Y[^Y

1条回答

网友

1楼 · 发布于 2024-09-29 20:29:22

仅匹配数字：

re.compile('SRR.*?\d{1,3}', re.DOTALL)

\d匹配字符0-9，{1,3}匹配其中1到3个字符。你知道吗

如果不想匹配以SRR开头然后后跟大于200的数字的任何内容，可以创建一个更挑剔的表达式：

re.compile('SRR.*?(?:[1-9]|[1-9]\d|1\d{2}|200)', re.DOTALL)

匹配1到9之间的一位数，或10到99之间的两位数，或100到199之间的三位数，或数字200。你知道吗

这些表达式都不能阻止匹配后面跟着更多的数字。您可能需要将\b边界锚点添加到表达式的末尾：

re.compile('SRR.*?\d{1,3}\b', re.DOTALL)

对于您发布的示例，我将显式地包含length=参数：

re.compile('SRR.*?length=(?:[1-9]|[1-9]\d|1\d{2}|200)', re.DOTALL)

相关问题更多 >

编程相关推荐

热门问题

热门文章