基于改进的方向性索引的hi-c数据层次域调用
calTADs的Python项目详细描述
简介
3C技术(5C,H-C)揭示了拓扑的存在性。 结合域(tads),一种普遍存在的亚巨碱基尺度的染色体结构。 tads是相邻的区域,在这些区域中,位点与 彼此之间的基因不在区域内。在视觉上,tads显示为正方形 沿着热图对角线的街区。
tad的识别方法有很多种[1],[2]。大多数方法 应用两步方案:首先,将tad或边界信号转换为1d 使用一些统计信息(例如方向性指数,di)进行剖面分析;然后,使用 一维剖面,用于识别潜在边界并生成一组离散的 不重叠的tads。然而,染色体结构的组织是 总是错综复杂的。Phillips Cremins Je等人[3]已使用 一种改进的多尺度di将tads细分为更小的次pologies(sub-tads) 使用5C数据。在这里,我将他们的算法扩展到整个基因组并开发 这个软件。
安装
请检查发行版中的文件“install.rst”。
用法
打开终端,键入calTADs -h获取帮助信息。
Caltads包含一个流程管理系统,因此您可以提交相同的 反复命令尽可能地利用并行电源。
参考
[1] | Dixon JR, Selvaraj S, Yue F et al. Topological domains in mammalian genomes identified by analysis of chromatin interactions. Nature, 2012, 485: 376-380. |
[2] | Sexton T, Yaffe E, Kenigsberg E et al. Three-dimensional folding and functional organization principles of the Drosophila genome. Cell, 2012, 148: 458-472. |
[3] | Phillips-Cremins JE, Sauria ME, Sanyal A et al. Architectural protein subclasses shape 3D organization of genomes during lineage commitment. Cell, 2013, 153(6):1281-95. |
[4] | Lieberman-Aiden E, van Berkum NL, Williams L et al. Comprehensive mapping of long-range interactions reveals folding principles of the human genome. Science, 2009, 326: 289-293. |
[5] | Rao SS, Huntley MH, Durand NC. A 3D map of the human genome at kilobase resolution reveals principles of chromatin looping. Cell, 2014, 159(7):1665-80. |