用Python解码

2024-10-01 05:04:05 发布

您现在位置:Python中文网/ 问答频道 /正文

我试图从一个文件的DNA序列中发现ASCII编码的文本。你知道吗

下面是我的代码:

第一种方法是打开FASTA文件并设置一个变量。你知道吗

with open("/home/<username>/python/progseq") as mydnaseq:
    sequence = mydnaseq.read().replace('\n','')

第二位是将序列转换成二进制,并将字母C和G/T转换为等于1:

binarysequence = sequence.replace('A','0')

然后我把这个looooong二进制序列变成8位:

for i in range(0,len(binarysequence),8):
    binarysequence [i:i+8]

然后创建如下输出:

    '00110100'
    '00110010'
    '01000110'
    '00011000'
    '0'

虽然我有一个更长的输出,我只包括最后四个序列。你知道吗

我想知道如何把它转换成字母。你知道吗


Tags: 文件方法代码文本编码字母ascii二进制
1条回答
网友
1楼 · 发布于 2024-10-01 05:04:05

例如a = '10010000',您可以

b = chr(int(a, 2))

首先将a转换为基于二进制数的整数,然后将此整数解释为字符。请注意,许多8位整数不会产生可读字符!你知道吗

一个具体的例子是

b = chr(int('01111000', 2))
print(b)

导致'x'被打印出来。你知道吗

相关问题 更多 >