用python实现计算可映射性敏感的互相关,用于片段长度估计和芯片序列的质量控制。
PyMaSC的Python项目详细描述
为了估计单端测序数据的平均片段长度,通常使用正链读取和负链读取之间的互相关。这种方法的一个问题是幻影峰值,它是与读取长度相对应的偶发观测峰值。在编码联盟的芯片序列指南中,片段长度和读取长度的互相关用于质量控制度量。此外,库长度本身也是分析的重要参数之一。然而,由于幻影峰值的出现,估计正确的标记长度并不是一件容易的事情。 P Ramachandran等人提出了masc、mappability敏感的互相关方法,以消除由于整个基因组的mappability不一致而引起的偏差。该方法提供了无虚峰的互相关景观和更精确的平均片段长度估计。 pymasc是由python和cython实现的一个工具,用masc算法可视化(可映射性敏感)互相关并估计芯片序列质量度量和平均片段长度。