基因组相互作用矩阵的稀疏二进制格式
cooler的Python项目详细描述
冷却器
存放hi-c的好地方
Cooler是稀疏、压缩、二进制持久存储format的支持库,也称为Cooler,用于存储基因组相互作用数据,如HI-C接触矩阵。
cooler文件格式是使用HDF5作为容器格式的基因组矩阵数据模型的实现。cooler
包包括一组command line tools和一个Python API以便于创建、查询和操作较冷的文件。
开始:
- Install冷却器
- 阅读documentation并查看jupyter笔记本walkthrough。
- cool来自已发布的hi-c数据集的文件可在
ftp://cooler.csail.mit.edu/coolers
获得。 - 在4DN data portal上还有更多的multires(mcool)文件可用。
安装
使用pip从pypi安装。
$ pip install cooler
如果您使用的是conda
,也可以从bioconda通道安装cooler
。
$ conda install -c conda-forge -c bioconda cooler
要求:
- Python2.7/3.4+
- libhdf5和python包
numpy
,scipy
,pandas
,h5py
。我们强烈建议使用conda
包管理器来安装这样的科学包。要获得它,您可以安装完整的Anacondapython发行版,也可以只安装独立的conda包管理器。
有关详细信息,请参见docs。
贡献
对酷感兴趣吗?太好了!要开始,请查看contributing guide。
引用
Abdennur,N.和Mirny,L.(2019年)。冷却器:可扩展存储hi-c数据和其他基因组标记阵列。生物信息学。doi:10.1093/bioinformatics/btz540。
@article{Cooler2019,author={Abdennur, Nezar and Mirny, Leonid A},title="{Cooler: scalable storage for Hi-C data and other genomically labeled arrays}",journal={Bioinformatics},year={2019},month={07},doi={10.1093/bioinformatics/btz540},url={https://doi.org/10.1093/bioinformatics/btz540},}
许可证
BSD(3条)