De Bruijn图形代码Python 3

2024-10-04 11:27:26 发布

您现在位置:Python中文网/ 问答频道 /正文

这是课堂作业。我不熟悉编码,有人建议我使用Python,因为它更容易处理。任务的重点是获取一个kmers列表并组装超弦,在本例中是DNA核苷酸并组装DNA序列。我们需要使用欧拉路径(算法),我还没想好怎么做。现在我正在研究,一个试图将我的kmer列表加载到Python(还没有弄清楚)并构建de Bruijn图。注意:我没有加载kmers的列表,因为我还没有想出怎么做。这只是我输入的随机DNA串。在

这是我的代码:

def de_bruijn_ize(st, k):
edges = []
nodes = set()
for i in range(len(st) - k + 1):
    edges.append((st[i:+k-1], st[i+1:i+k]))
    nodes.add(st[i:i+k-1])
    nodes.add(st[i+1:i+k])
return nodes, edges

nodes, edges = de_bruijn_ize(“CCGGTTAAACGTC”, 3)
print(nodes)
print(edges)

尝试运行时收到以下消息:

“文件”practiceassembly.txt“,第11行 节点,边=de_bruijn_-ize(“CCGGTTAAACGTC”,3) ^ SyntaxError:标识符中的字符无效

如有任何帮助/建议,我们将不胜感激。如果有人能为这类问题提供好的资源,我也会非常感激的。在

我有一点进步。我成功地打开了我的kmer文件: 是的,我成功地做到了:

^{pr2}$

我得到了kmers的名单:

AAAC公司 亚卡 AACG公司 亚格 ACAC公司 ACAG公司 ACGC公司 ACGG公司 ACTG公司 AGCA公司 阿加 AGGC公司 ATCA公司 ATTC公司 中国民航总局 卡卡 CACG公司 CAGG公司 有线电视 CGCG公司 CGGT公司 CGTA公司 CGTG公司 CTAA CTCT CTGG公司 CTTA公司 GACT公司 全球通讯卫星 GCGT公司 GCTC公司 GCTT公司 GGAC公司 GGCA公司 GGCT公司 GGGT公司 GGTG公司 GGTT公司 GTAT公司 GTGC公司 GTGG公司 GTTT TAAA公司 塔克 塔特 TCAA TCAC公司 TCGT公司 TCTA公司 TGCT TGGC公司 TGGG公司 TTAA公司 TTCA公司 TTCG公司 TTTC公司 TTTT 设置() [] 但其余的都没有实现。我想我已经差不多可以让这件事发挥作用了(也许我只是希望在这里),但我只是需要一点帮助。在


Tags: add列表公司de建议dnanodesst
2条回答

除了逻辑上的任何错误外,你行中的引号:

    nodes, edges = de_bruijn_ize(“CCGGTTAAACGTC”, 3)

是其他一些奇怪的字符,替换为:

^{pr2}$

这在python3中是有效的。我很好奇那些引语是什么。在

使用的引号不是标准的(可能是pdf的复制粘贴?)公司名称:

替换:

nodes, edges = de_bruijn_ize(“CCGGTTAAACGTC”, 3)

有:

^{pr2}$

相关问题 更多 >