线粒体基因组管道
mitopipeline的Python项目详细描述
开始
此项目可以通过pip install mitopipeline下载以安装最新版本的mitoppipeline。或者,可以通过git clone https://github.com/timmykuo/mitopipeline.git直接克隆存储库,导航到克隆的存储库,然后运行python3 setup.py install。Documentation通过readthedocs托管。
用户必须下载samtools和bwa,makethem,并在其$path变量中包含可执行文件的路径,或者将它们复制到其binfolder中,以便可以从命令行运行它们。下载samtools和bwa的链接。此外,他们希望自己使用的第三方软件包(如gatk、annovar等)需要下载才能在管道中使用。
目的
在遗传学研究中,研究人员通常要求原始的基因组数据首先在不同的软件上运行,以提取有用的信息,如变异信息,然后才能进行分析。因此,我们希望提供一个管道,允许用户自动简化他们的处理流程。
该管道中包括的步骤包括从人类基因组中提取线粒体基因组、剪裁、分割完整基因组数据的间隙、对齐到numt清除,以及其他软件包,如gatk、snpeff、annovar。
管道
此图中显示的步骤将在“管道步骤”页中进一步描述。如果您的管道不需要每个步骤,则可以省略它。
学分
依赖项管理通过一个名为Luigi的python包来控制。此外,管道中的许多步骤都改编自sneha grandhi编写的脚本。看看她Github,LinkedIn,或者通过她的电子邮件联系她:sneha_grandhi@hms.harvard.edu。