我现在的处境是,我收集了5个DNA序列的列表。我写了一个小循环,一次遍历一个密码子位点。从这里我生成了一个字典,告诉我每个密码子位点上都有哪些密码子,代码如下所示:
for i in range(0, len(sequencesCombined[0]), 3):
codons = {}
for j in range(len(sequencesCombined)):
codon = sequencesCombined[j][i:i+3]
if codon not in codons:
codons[codon] = 1
else:
codons[codon] += 1
if len(codons) == 2:
if AminoAcid_Table[codons[0]] == AminoAcid_Table[codons[1]]:
print('whatever my string needs to be')
else:
print('whatever my other string needs to be')
else:
pass
这个循环在一定程度上起作用,它循环遍历序列,每3个核苷酸切片一次,然后读取密码子。然后在检查下一个密码子位点之前刷新自身。然而,为了编写if-else语句,我正在努力将值与另一个字典进行匹配
任何随机站点的输出示例可能如下所示:
'ATG':5
这告诉我在5个序列中有5个ATG密码子。 或者,它可能如下所示:
'CCT':2, 'CAA':3
因此,这是一个非同义密码子替换,因为两个序列表达编码脯氨酸的密码子CCT,3个序列表达编码谷氨酸的密码子CAA。在这种情况下,替换为CCT,因为只有2个。(或者至少这是我被指示的假设)最终我将统计这些非同义和同义替换,但现在我只想让python告诉我替换是同义还是非同义,以及理想情况下被替换的密码子是什么,因此打印函数。因此,此场景的输出可能如下所示:
'Non-Synonymous Sub, Codon: CCT'
我写了一本包含所有氨基酸及其密码子的字典,如下所示:
AminoAcid_Table = {
'TTT':'Phe','TCT':'Ser','TAT':'Tyr','TGT':'Sys',
'TTC':'Phe','TCC':'Ser','TAC':'Tyr','TGC':'Sys',
'TTA':'Leu','TCA':'Ser','TAA':'Stop','TGA':'Stop',
'TTG':'Leu','TCG':'Ser','TAG':'Stop','TGG':'Trp',
'CTT':'Leu','CCT':'Pro','CAT':'His','CGT':'Arg',
'CTC':'Leu','CCC':'Pro','CAC':'His','CGC':'Arg',
'CTA':'Leu','CCA':'Pro','CAA':'Gln','CGA':'Arg',
'CTG':'Leu','CCG':'Pro','CAG':'Gln','CGG':'Arg',
'ATT':'Ile','ACT':'Thr','AAT':'Asn','AGT':'Ser',
'ATC':'Ile','ACC':'Thr','AAC':'Asn','AGC':'Ser',
'ATA':'Ile','ACA':'Thr','AAA':'Lys','AGA':'Arg',
'ATG':'Met','ACG':'Thr','AAG':'Lys','AGG':'Arg',
'GTT':'Val','GCT':'Ala','GAT':'Asp','GGT':'Gly',
'GTC':'Val','GCC':'Ala','GAC':'Asp','GGC':'Gly',
'GTA':'Val','GCA':'Ala','GAA':'Glu','GGA':'Gly',
'GTG':'Val','GCG':'Ala','GAG':'Glu','GGG':'Gly'}
我需要做的是让Python查看我的“密码子”字典输出的3个字母密码子,比较我的“氨基酸表”字典中的这两个密码子,如果氨基酸相同,那么我需要“同义”打印输出,如果不是,我需要“非同义”打印输出
如果您有任何建议,我们将不胜感激。如果您以前有过这样的问题,请留下一个信息链接。我很乐意投票给你这个答案
让我首先确认我对这个问题的理解是正确的
所以在你的字典密码中,你要检查所有的键是否指向表中的一个氨基酸。如果是,输出是同步的,否则不是同步的,对吗
如果是,您可以这样做来检查
相关问题 更多 >
编程相关推荐