illumina数据集的质量控制管道。该管道去除污染物(如Phix),执行fastqc、适配器清洁和修整,并检查污染物

sequana-quality-control的Python项目详细描述


这是来自Sequana项目的^{str1}$质量控制管道

Overview:A quality control pipeline for illumina data set. This pipeline removes contaminants (e.g. Phix), performs fastqc, adapter cleaning and trimming and checks for contaminants
Input:Raw fastq files
Output:Cleaned fastQ files, remove phix and adapters + taxonomy
Status:production.
Citation:Cokelaer et al, (2017), ‘Sequana’: a Set of Snakemake NGS pipelines, Journal of Open Source Software, 2(16), 352, JOSS DOI doi:10.21105/joss.00352

安装

必须先安装Seguana:

pip install sequana

然后,只需安装以下软件包:

^{pr2}$

使用

sequana_pipelines_quality_control --help
sequana_pipelines_quality_control --input-directory DATAPATH

这将创建一个包含管道和配置文件的目录。然后你需要 要执行管道:

cd quality_control
sh quality_control.sh  # for a local run

这是一条蛇形管道。如果你熟悉蛇咬,你可以 检索管道本身及其配置文件,然后使用特定参数自行执行管道:

snakemake -s quality_control.rules -c config.yaml --cores 4 --stats stats.txt

或者使用sequanix接口。在

要求

此管道需要以下可执行文件:

  • 快速质控
  • bwa公司
  • kraken(可选)
  • 克朗(可选)
  • 桑班巴
  • samtools公司
  • 皮格斯
  • 卡特达普[或阿托波斯]
https://raw.githubusercontent.com/sequana/sequana_quality_control/master/sequana_pipelines/quality_control/dag.png

细节

此管道在输入的fastq文件上并行运行quality\u control(成对或不成对)。 同时还制作了一份简短的Seguana摘要报告。在

规则和配置详细信息

这是latest documented configuration file 与管道一起使用。管道中使用的每个规则在配置文件中可能有一个部分。在

变更日志

^{tb2}$

欢迎加入QQ群-->: 979659372 Python中文网_新手群

推荐PyPI第三方库


热门话题
java RFID不完整输出?   java如何构造一个for循环来查找每个数组的第一个索引的总和   java Eclipse AST解析器正在删除我的规则   安卓如何在java中创建“可重写”配置?   java每次我向应用程序添加图像时,它都会崩溃   Java 8流到文件   EntityNotFoundException的java可能原因   java多线程为什么下面的程序表现得如此怪异?   java footprint soap api+mavenjaxb2plugin   java MongoDB锁定,直到找到结果   java重写Jtable选项卡行为转到下一个可编辑单元格   java关于方法和创建另一个方法   java将人脸与图像分离   java复制Spring批处理作业实例   java TextView不会更改为新设置的文本