如何在excel文件中将三个字母的氨基酸转换为单个字母

2024-09-30 14:36:52 发布

您现在位置:Python中文网/ 问答频道 /正文

我想将excel中一列由三个字母组成的氨基酸转换为一个字母,并将一个字母的氨基酸打印到excel文件中相应的每一行。我知道我可以用biopython来做这个

我所尝试的:

import Bio
from Bio.SeqUtils import seq1
seq1("MetAlaIleValMetGlyArgTrpLysGlyAlaArgTer")
'MAIVMGRWKGAR*'

但我希望大家理解,我不能为python转换字符串。我需要在excel中阅读一整列,然后按转换后的1个字母顺序打印一个新列。供参考的图片:

例如: enter image description here


Tags: 文件字符串fromimport顺序字母图片excel
1条回答
网友
1楼 · 发布于 2024-09-30 14:36:52

也许你可以试试下面的脚本。您需要将其扩展为所有可能的三个字母组合。希望这对你有用

# open file 
import pandas as pd
df = pd.read_excel (r'file')
df.columns=['three letter code']

codes = []
for i in df['code']:
  if i == 'uuu':
    codes.append('U')
  if i == 'cuu':
    codes.append('C')    
  if i == 'uaa':
    codes.append('A')
print (codes)
df['new_code']= codes
df

输出为:

        code    new_code
0       uuu     U
1       cuu     C
2       uaa     A

相关问题 更多 >