我试图从一个文件的DNA序列中发现ASCII编码的文本。你知道吗
下面是我的代码:
第一种方法是打开FASTA文件并设置一个变量。你知道吗
with open("/home/<username>/python/progseq") as mydnaseq:
sequence = mydnaseq.read().replace('\n','')
第二位是将序列转换成二进制,并将字母C和G/T转换为等于1:
binarysequence = sequence.replace('A','0')
然后我把这个looooong二进制序列变成8位:
for i in range(0,len(binarysequence),8):
binarysequence [i:i+8]
然后创建如下输出:
'00110100'
'00110010'
'01000110'
'00011000'
'0'
虽然我有一个更长的输出,我只包括最后四个序列。你知道吗
我想知道如何把它转换成字母。你知道吗
例如
a = '10010000'
,您可以首先将
a
转换为基于二进制数的整数,然后将此整数解释为字符。请注意,许多8位整数不会产生可读字符!你知道吗一个具体的例子是
导致
'x'
被打印出来。你知道吗相关问题 更多 >
编程相关推荐