所谓的2-gram是指由两个连续字母组成的块。例如,在序列AACTGC中,我们可以找到五种不同的2克:AA、AC、CT、TG和GC(注意,两个连续的2克在一个字母中重叠)。很容易看出,在一系列的𝑁 信,我们可以数𝑁−1.2克(其中许多可能重复,因此不同2克的总数可能更小)
对于由字母表大小为4的字母组成的序列(如病毒RNA,其字母表由四个字母A、C、G和T组成),总共有24=16个可能的2克:AA、AC、AG、AT、…、TT
通过修改函数freq()(或其他方式),计算并绘制病毒序列中2克频率的直方图(条形图)。x轴应描绘四个核苷酸的所有十六种组合
你想要这个吗-&燃气轮机
如果要保留订单->
这是一个开始,试着适应你的问题
据我所知,这就是你想要做的:
只需根据
two_gram
绘制直方图相关问题 更多 >
编程相关推荐