你怎么分析fna.gz公司在python中?

2024-05-17 04:02:39 发布

您现在位置:Python中文网/ 问答频道 /正文

我想把我的第N个碱基对还给我fna.gz公司基因组输入。理论上它是这样工作的:

allele = genome[14325]
print(allele)
#: G

这是我现在掌握的代码:

^{pr2}$

但它不起作用,我得到一个错误:

UnicodeDecodeError: 'charmap' codec can't decode byte 0x8f in position 386: character maps to <undefined>

Tags: 代码基因组genome错误公司理论cancodec
1条回答
网友
1楼 · 发布于 2024-05-17 04:02:39

你可以的

  • 尝试先打开.gz文件,然后再将其作为fasta [1]读取:
    with gzip.open("practicezip.fasta.gz", "rt") as handle:
        for record in SeqIO.parse(handle, "fasta"):
            #your code
  • 如果错误仍然存在,请在解析函数中指定编码。正如biopythonseqio手册所述:“对于像FASTA这样无法确定字母表的文件格式,显式地指定字母表可能是有用的”。所以:
^{pr2}$

除了UnicodeDecodeError错误之外,您可能还需要定义函数some_function(sequence),否则Python将不知道当您调用它时该做什么。例如:

^{3}$

相关问题 更多 >