改进种群基因组的工具箱。
cleanm的Python项目详细描述
#清洁
<;b>;[此项目正在开发中,目前不推荐用于公共用途。]<;b>;
cleam是一套改进种群基因组的工具。它提供了改进基因组完整性的方法以及识别和去除污染的方法。Currm只包含全基因组QC流水线的一部分,应该与现有的QC工具[CuCHKM](^ {A1})结合使用。当前计划的功能是:
<;i>;提高完整性:<;i>; *鉴定与密切相关参考基因组同源的contigs *用兼容的GC、覆盖率和四核苷酸特征识别contigs *确定应该合并在一起的部分群体基因组(需要[checkm](https://github.com/Ecogenomics/CheckM/wiki))
<;i>;减少污染:<;i>; *对基因组中的contig进行分类以识别异常值 *识别具有不同GC含量、覆盖范围或四核苷酸特征的contigs *用暗示真核生物起源的编码密度识别contigs
##安装
安装此软件包的最简单方法是通过PIP: >;sudo pip安装cleanm
此软件包需要安装numpy并使用以下生物信息软件包:
checkm依赖于其他几个软件包:
- [浪子](http://prodigal.ornl.gov/):凯悦D、洛卡西奥PF、豪泽LJ、尤伯巴赫EC。2012年。基因组序列中的基因和翻译起始位点预测。&生物信息学28:2223-2230。
- [爆炸+](http://blast.ncbi.nlm.nih.gov/Blast.cgi?PAGE_TYPE=BlastDocs&DOC_TYPE=Download):卡马乔C,库卢里斯G,阿瓦吉安V,马恩,帕帕多普洛斯J,比勒K,马登TL.2009.blast+:架构和应用程序。<;I>;BMC生物信息学<;I>;10:421:DOI:10.1186/1471-2105-10-421。
- [钻石](http://ab.inf.uni-tuebingen.de/software/diamond/)布奇芬克B,谢C,胡森DH。2015年。使用钻石快速和敏感的蛋白质校准。<;i>;自然方法<;i>;12:59–60 doi:10.1038/nmeth.3176。
##引用
如果您觉得这个包有用,请引用这个git存储库(https://github.com/dparks1134/CleanM)
##版权所有
版权所有©2015多诺万公园。有关详细信息,请参见许可证。