如何在python正则表达式中将数字大小限制为单个

filepointer = open(filename,"r") # Reading file text = filepointer.read() merged = text.splitlines() for i in merged: print re.sub("[0-5]x[a-zA-Z]","", i.rstrip())#Replace 1x,2x,3x,4x,5x by nothing

2条回答

网友
1楼 · 编辑于 2024-09-30 14:27:16

另一种方法是使用函数-
reg.txt内容如下-
155 Phe 12xD,7xQ,5xE,5xG,4xA,4xS,2xF,2xH,2xI,2xK,1xM,1xN 151 Glu 11xD,6xA,5xE,3xF,3xG,3xM,2xI,2xS,1xH,1xK,1xL,1xP 159 Thr 15xF,6xL,6xM,5xG,5xI,5xT,4xA,4xV,3xR,1xD,1xN,1xP
p = r"C:\reg.txt" f = open(p,'rb').readlines() def changer(l): d= l.split(',') dd = d[1:] lst = ['6', '7', '8', '9'] s = [i for i in dd if i[0] in lst] s.insert(0,d[0]) return ','.join(s) for i in f: print changer(i)
印刷品-
155 Phe 12xD,7xQ 151 Glu 11xD,6xA 159 Thr 15xF,6xL,6xM

网友
2楼 · 编辑于 2024-09-30 14:27:16

你可以用
re.sub(r",?\b[0-5]x[a-zA-Z]\b","", s)
见IDEONE demo
regex-,?\b[0-5]x[a-zA-Z]\b具有word boundary\b的特性，因此数字+x+字母的前后必须是非单词字符（不是[a-zA-Z0-9_]），并且逗号在开头是可选的（因为?匹配前面子模式的1或0次出现）。你知道吗
另外，请注意，正则表达式最好使用“原始”字符串文字来声明（请参见r""表示法）。这样，在使用单词边界时就不必使用双反斜杠。你知道吗

相关问题更多 >

编程相关推荐

热门问题

热门文章