sequana\u coverage独立应用程序的并行版本。

sequana-coverage的Python项目详细描述


这是来自Sequana项目的^{str1}$coverage管道

Overview:

Parallelised version of sequana_coverage for large eukaryotes genome.

Input:

A set of BAM or BED files. BED file must have 3 or 4 columns. First column is the chromosome/contig name, second column stored positions and third the coverage. Fourth optional columns contains a filtered coverage (not used in the analysis but shown in the HTML reports)

Output:

a set of HTML reports for each chromosomes and a multiqc report

Status:

production

Citation:

Dimitri Desvillechabrol, Christiane Bouchier, Sean Kennedy, Thomas Cokelaer Sequana coverage: detection and characterization of genomic variations using running median and mixture models GigaScience, Volume 7, Issue 12, December 2018, giy110, https://doi.org/10.1093/gigascience/giy110

and

Cokelaer et al, (2017), ‘Sequana’: a Set of Snakemake NGS pipelines, Journal of Open Source Software, 2(16), 352, JOSS DOI https://doi:10.21105/joss.00352

安装

必须先安装Seguana:

pip install sequana

然后,只需安装以下软件包:

^{pr2}$

这提供了一个名为sequona_pipelines_coverage的可执行文件。应该注意的是 不要与原始的Seguana_独立于Sequona的报道混淆 图书馆。事实上,这条管道称之为Seguana_报道现场。在

使用

sequana_pipelines_coverage --help
sequana_pipelines_coverage --input-directory DATAPATH

默认情况下,这将查找BED file。警告。这是BED3意思是3列 像这样的表格文件:

chr1 1 10
chr1 2 11
...
chr1 N1 10
chr2 1 20
chr2 2 21
...
chr2 N2 20

第一列存储染色体名称,第二列是位置 第三是报道本身。请参阅Seguana_保险范围文档 细节。如果您有BAM文件作为输入,我们将为您进行转换。在 在这种情况下,请使用此选项:

--input-pattern "*.bam"

seguana_pipelines_coverage脚本创建一个包含管道和 它的配置文件。然后你需要 要执行管道:

cd coverage
sh coverage.sh  # for a local run

这是一条蛇形管道。如果你熟悉蛇咬,你可以 检索管道本身及其配置文件,然后使用特定参数自行执行管道:

snakemake -s coverage.rules -c config.yaml --cores 4 --stats stats.txt

或使用sequanix接口,如下所示:

sequanix -w analysis -i . -p coverage

转到第二个面板,在Input data中,然后在Input directory中。好了,你 必须修改模式(默认为空字段表示搜索fastq文件) 并将字段设置为:

*.bed

或者:

*.bam

你准备好了。保存项目并按Run。完成后,打开HTML报告。在

要求

此管道需要以下可执行文件:

  • Seguana_coverage from Seguana,应自动安装。在
  • 多重质量控制

细节

此管道在输入的BAM文件(或BED文件)上并行运行coverage。在

覆盖率工具将BAM或BED文件作为输入。床上的文件必须有3个 或独立应用程序中解释的4列(Seguana_coverage) documentation。 简而言之,第一列是染色体名称,第二列是 位置(已排序),第三列是覆盖率(可选的第四列 列将包含一个覆盖信号,它可以是 实例)。在

如果只有BAM文件,可以使用bioconvert工具或 命令:

samtools depth -aa input.bam > output.bed

如果您有CRAM文件:

samtools view -@ 4 -T reference.fa -b -o out.bam  in.cram

对于非常大的BAM/BED文件,我们建议将BED文件拆分为 染色体。例如,对于染色体chr1,键入:

# samtools index in.bam
samtools depth -aa input.bam -r chr1 in.bam > chr1.bed

独立或Snakemake应用程序也可以将您的BAM文件作为输入 会自动转换成一个床文件。在

规则和配置详细信息

这是latest documented configuration file 与管道一起使用。管道中使用的每个规则在配置文件中可能有一个部分。在

变更日志

^{tb2}$

欢迎加入QQ群-->: 979659372 Python中文网_新手群

推荐PyPI第三方库


热门话题
java在OSGi felix scr注释中将运行时参数传递给服务   java如何按字母顺序将对象插入ArrayList?   在Netbeans中调试Java   java从json文件中获取不同的照片   通过迭代和打印将java插入2个哈希表的运行时间   java如何替换JUnit 5中的WireMock@Rule注释?   shell在javajsch程序中使用'been'命令访问受限目录   java RMI是什么类型的?   javajooq别名构造   java如何通过在testNG中创建对象来调用测试方法   java下载从安卓 URL加载到imageview中的图像   从java运行bat文件   带有客户端证书的java嵌入式Jetty   java Ajax将JSON数组发送到servlet   创建数据并将数据添加到SQLite数据库时发生java错误   添加CV的javascript HRMS项目过程   java AspectJ加载时编织不起作用   java动态更改(使用JMX)正在监视的文件夹中的新文件   java岛数迭代矩阵并将节点标记为已访问