使用字典替换pandas数据帧中的字符串而不重写

AA_code = {re.compile('[C]'): 'Cys',re.compile('[D]'): 'Asp', re.compile('[S]'): 'Ser',re.compile('[Q]'): 'Gln',re.compile('[K]'): 'Lys', re.compile('[I]'): 'Ile',re.compile('[P]'): 'Pro',re.compile('[T]'): 'Thr', re.compile('[F]'): 'Phe',re.compile('[N]'): 'Asn',re.compile('[G]'): 'Gly', re.compile('[H]'): 'His',re.compile('[L]'): 'Leu',re.compile('[R]'): 'Arg', re.compile('[W]'): 'Trp',re.compile('[A]'): 'Ala',re.compile('[V]'): 'Val', re.compile('[E]'): 'Glu',re.compile('[Y]'): 'Tyr',re.compile('[M]'): 'Met'}

2条回答

网友

1楼 · 编辑于 2024-06-26 04:59:10

乔恩的回答很好。根据他的意见，另一种方法是

import pandas as pd

lookup = {
    'Q': 'Gln',
    'K': 'Lys',
    'E': 'Glu',
    'G': 'Gly'
     # needs completing...
}

s = pd.Series(['Q79K,E17K', 'Q79K,E17K', 'T315I'])
s.apply(lambda row: "".join([lookup[x] if x in lookup else x for x in row]))

或者，正如@Jon Clements在评论中建议的那样

s.apply(lambda row: "".join([lookup.get(x,x) for x in row]))

这给了你

^{pr2}$

网友

2楼 · 编辑于 2024-06-26 04:59:10

创建一个查找表，然后在Series.str.replace中的可调用中使用它，例如：

import pandas as pd

lookup = {
    'Q': 'Gln',
    'K': 'Lys',
    'E': 'Glu',
    'G': 'Gly'
    # needs completing...
}

s = pd.Series(['Q79K,E17K', 'Q79K,E17K', 'T315I'])
s.str.replace('([{}])'.format(''.join(lookup)), lambda m: lookup[m.group(1)])

给你：

^{pr2}$

相关问题更多 >

编程相关推荐

热门问题

热门文章