找出一个核苷酸在同一位置出现的次数

网友

1楼 · 编辑于 2024-04-28 06:13:00

很接近，但需要跟踪索引，而不是单个查找

[sum(x[i] == "A" for x in sequences) for i in range(len(sequences[0]))]

网友

2楼 · 编辑于 2024-04-28 06:13:00

这将同时迭代每个索引，并为每个核苷酸出现添加一个索引

result = {'A': 13*[0], 'G': 13*[0], 'T': 13*[0], 'C': 13*[0]}
for index, sequence in enumerate(zip(*sequences)):
    for nucleotide in sequence:
        result[nucleotide][index] += 1

输出：

{'A': [1, 4, 1, 0, 0, 3, 4, 1, 1, 3, 0, 2, 0], 'G': [1, 0, 4, 6, 0, 0, 1, 3, 1, 0, 0, 1, 2], 'T': [3, 0, 0, 0, 6, 1, 0, 2, 3, 3, 2, 3, 0], 'C': [1, 2, 1, 0, 0, 2, 1, 0, 1, 0, 4, 0, 4]}

网友

3楼 · 编辑于 2024-04-28 06:13:00

您发布的代码只是部分代码，但是您对每个索引迭代了一次sequences。您可以使用zip在一次过程中对它们进行计数（即使最后您必须读取每个字符一次，因此我的解决方案只更改读取顺序）：

A = []
for s in zip(*sequences):
    print(s)
    num_a = 0
    for nuc in s:
        if nuc == "A":
            num_a += 1
    A.append(num_a)
print(A)

{}的内容是：

('G', 'T', 'C', 'A', 'T', 'T')
('A', 'C', 'A', 'C', 'A', 'A')
('G', 'C', 'G', 'A', 'G', 'G')

依此类推，您可以看到所有序列一次读取一个字符，结果是：

[1, 4, 1, 0, 0, 3, 4, 1, 1, 3, 0, 2, 0]

如果序列的长度不同，可以使用^{} 用另一个字符填充较短的序列

干杯

相关问题更多 >

编程相关推荐

热门问题

热门文章

找出一个核苷酸在同一位置出现的次数

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >