sequana\u coverage独立应用程序的并行版本。
sequana-coverage的Python项目详细描述
这是来自Sequana项目的^{str1}$coverage管道
Overview: | Parallelised version of sequana_coverage for large eukaryotes genome. |
---|---|
Input: | A set of BAM or BED files. BED file must have 3 or 4 columns. First column is the chromosome/contig name, second column stored positions and third the coverage. Fourth optional columns contains a filtered coverage (not used in the analysis but shown in the HTML reports) |
Output: | a set of HTML reports for each chromosomes and a multiqc report |
Status: | production |
Citation: | Dimitri Desvillechabrol, Christiane Bouchier, Sean Kennedy, Thomas Cokelaer Sequana coverage: detection and characterization of genomic variations using running median and mixture models GigaScience, Volume 7, Issue 12, December 2018, giy110, https://doi.org/10.1093/gigascience/giy110 and Cokelaer et al, (2017), ‘Sequana’: a Set of Snakemake NGS pipelines, Journal of Open Source Software, 2(16), 352, JOSS DOI https://doi:10.21105/joss.00352 |
安装
必须先安装Seguana:
pip install sequana
然后,只需安装以下软件包:
^{pr2}$这提供了一个名为sequona_pipelines_coverage的可执行文件。应该注意的是 不要与原始的Seguana_独立于Sequona的报道混淆 图书馆。事实上,这条管道称之为Seguana_报道现场。在
使用
sequana_pipelines_coverage --help sequana_pipelines_coverage --input-directory DATAPATH
默认情况下,这将查找BED file。警告。这是BED3意思是3列 像这样的表格文件:
chr1 1 10 chr1 2 11 ... chr1 N1 10 chr2 1 20 chr2 2 21 ... chr2 N2 20
第一列存储染色体名称,第二列是位置 第三是报道本身。请参阅Seguana_保险范围文档 细节。如果您有BAM文件作为输入,我们将为您进行转换。在 在这种情况下,请使用此选项:
--input-pattern "*.bam"
seguana_pipelines_coverage脚本创建一个包含管道和 它的配置文件。然后你需要 要执行管道:
cd coverage sh coverage.sh # for a local run
这是一条蛇形管道。如果你熟悉蛇咬,你可以 检索管道本身及其配置文件,然后使用特定参数自行执行管道:
snakemake -s coverage.rules -c config.yaml --cores 4 --stats stats.txt
或使用sequanix接口,如下所示:
sequanix -w analysis -i . -p coverage
转到第二个面板,在Input data中,然后在Input directory中。好了,你 必须修改模式(默认为空字段表示搜索fastq文件) 并将字段设置为:
*.bed
或者:
*.bam
你准备好了。保存项目并按Run。完成后,打开HTML报告。在
要求
此管道需要以下可执行文件:
- Seguana_coverage from Seguana,应自动安装。在
- 多重质量控制
细节
此管道在输入的BAM文件(或BED文件)上并行运行coverage。在
覆盖率工具将BAM或BED文件作为输入。床上的文件必须有3个 或独立应用程序中解释的4列(Seguana_coverage) documentation。 简而言之,第一列是染色体名称,第二列是 位置(已排序),第三列是覆盖率(可选的第四列 列将包含一个覆盖信号,它可以是 实例)。在
如果只有BAM文件,可以使用bioconvert工具或 命令:
samtools depth -aa input.bam > output.bed
如果您有CRAM文件:
samtools view -@ 4 -T reference.fa -b -o out.bam in.cram
对于非常大的BAM/BED文件,我们建议将BED文件拆分为 染色体。例如,对于染色体chr1,键入:
# samtools index in.bam samtools depth -aa input.bam -r chr1 in.bam > chr1.bed
独立或Snakemake应用程序也可以将您的BAM文件作为输入 会自动转换成一个床文件。在
规则和配置详细信息
这是latest documented configuration file 与管道一起使用。管道中使用的每个规则在配置文件中可能有一个部分。在
变更日志
^{tb2}$- 项目
标签: