短核苷酸序列的生物ython-blast参数

result_handle = NCBIWWW.qblast("blastn", "nr", fastaSequence, word_size=7, gapcosts='5 2', nucl_reward=1, nucl_penalty='-3', expect=1000)

2条回答

网友

1楼 · 编辑于 2024-09-27 17:50:28

此代码适用于我（Biopython 1.64）：

^{1}$

也许你通过了一个错误的快速顺序。Biopython没有从SeqRecords（或任何东西）到普通FASTA的任何转换。您必须提供如上所示的查询。在

Blast确定序列是核苷酸还是蛋白质，读取前几个字符。如果它们在“ACGT”中高于阈值，那就是核苷酸，否则就是蛋白质。因此，你的序列处于100%的“ACGT”阈值，不可能被解释为蛋白质。在

网友

2楼 · 编辑于 2024-09-27 17:50:28

有一次我在爆破肽方面遇到了问题，这似乎是一个正确选择参数的问题。我花了很长时间才弄清楚它们到底应该是什么（各种网站上不一致且稀少的数据，包括这方面NCBI文档中相当复杂的数据）。我知道你对爆破核苷酸序列感兴趣，但你可能会找到你的解决方案，同时看看下面的代码。尤其要注意参数filter、composition_based_statistics、word_size和{}。对我来说，他们似乎是至关重要的。在

^{1}$

相关问题更多 >

编程相关推荐

热门问题

热门文章