PM4NGS为下一代测序(ngs)数据分析生成标准组织结构
pm4ngs的Python项目详细描述
PM4NGS:NGS数据分析项目经理
PM4NGS旨在为下一代测序生成标准组织结构 数据分析包括项目的目录结构、用于数据管理的Jupyter笔记本和CWL工作流 用于管道执行。在
我们的研究灵感来自威廉·诺布尔教授2009年发表的一篇论文: A Quick Guide to Organizing Computational Biology Projects。 我们强烈建议阅读本文,以便更好地理解本项目的指导原则。在
项目由三个主要部分组成。第一个是project组织结构 为项目定义标准文件和目录。第二部分是作为用户的Jupyter笔记本 用于数据管理和可视化的接口。第三部分是执行数据的CWL工作流 分析。在
PM4NGS源代码包括cookiecutter用于生成项目的模板 组织结构和Jupyter笔记本。CWL工作流在一个单独的GitHub项目中定义,该项目名为: cwl-ngs-workflows-cbb。在
由Cookiecutter驱动, Jupyter Notebook,CWL,Docker, Conda和{a8}。在
文件
有关详细信息,请转到https://pm4ngs.readthedocs.io。在
参考文献
Vera Alvarez R,Pongor LS,Mariño-Ramírez L和Landsman D.Containerized open-source framework for NGS data analysis and management[版本1;未经同行评审]。F1000Research 2019,8(ISCB Comm J):1229(海报)(doi:10.7490/F1000Research.1117155.1)
特点
- 基于Jupyter笔记本、CWL工作流和cookiecutter项目模板的NGS数据集成、管理和分析
- 易于安装和使用,命令行交互最少。在
- 数据分析CWL工作流从Jupyter笔记本电脑执行,具有自动故障检测功能,并使用发布的数据进行验证
- CWL工作流和Jupyter笔记本电脑准备好进行云计算
- 使用CWL创建项目内容后的工作流和动态数据处理
- Docker/Biocontainers或Conda/Bioconda用于生物信息学工具的安装和管理
外部依赖关系
- 波普勒
公共领域通知
国家生物技术信息中心。在
这个软件是“美国政府工作”项下的美国条款 版权法。这是作者作为美国官方职责的一部分 政府雇员因此不能享有版权。这个软件是免费提供的 供公众使用。美国国家医学图书馆和美国政府没有 对其使用或复制有任何限制。在
虽然已经尽了一切合理的努力来确保准确性和可靠性 对于软件和数据,NLM和美国政府没有也不能保证 使用此软件或数据可能获得的性能或结果。全国民主联盟和 美国政府否认所有明示或暗示的保证,包括保证 性能、适销性或对任何特定目的的适用性。在
请在基于此材料的任何作品或产品中引用NCBI。在
- 项目
标签: