分析真菌基因组数据的管道

vbtools的Python项目详细描述


vbtools:一个用于比较vcf与一致性集的变体基准工具

安装

安装之前,请确保conda位于PATH下。conda安装here

# clone this repo
git clone git@github.com:broadinstitute/vbtools.git

# setup conda environmentcd vbtools

conda env create -f env.yml # this will take a few minutes
conda list  # verify new environment was installed correctly# activate environment
conda activate vbtools

# deactivate the environment when done
conda deactivate

# completely remove the virtual environment
conda remove -name vbtools --all

用法

您可以使用以下命令根据参考/一致性VCF对VCF进行基准测试。

vcfbench.py -v <input.vcf> -b <reference.vcf>

--prefix是定义输出文件前缀的选项。

目前,分析只支持单倍体vcf。二倍体VCF在比较前将标准化为单倍体。输入vcf应该跟在VCF spec v4.2后面。

在分析之前,对输入VCF执行以下预处理步骤:

  1. 删除未使用的等位基因
  2. 去除单晶位点
  3. 去除杂合基因型的位点
  4. 删除非SNP站点
  5. 删除带有星号标记的网站
  6. 二倍体转化为单倍体vcf

脚本将输出:

  1. 站点级别比较:
    • 一个TSV文件,包括唯一和共享站点的数量。
  2. 样本水平比较:
    • 示例级别比较功能将很快添加到脚本中。

欢迎加入QQ群-->: 979659372 Python中文网_新手群

推荐PyPI第三方库


热门话题
java关闭域实例   java如何获得JTable列的头组件的最小首选宽度,以便其大小不能小于该值?   使用时使用java Jsoup。孩子们()。跳出边界性感觉   类静态初始化块内的java类用法   java ParseCrashReporting*。在其Android SDK的1.11.0中找不到jar   javahsqldb组织。springframework。刀。复杂选择上的TransientDataAccessResourceException   java EJB 3.1@SessionScoped Bean holding登录信息注销问题   java如何跟踪重复警报何时关闭并更新设置值?   具有可变参数类型的java接口方法   使用openstack4j计算查询的java连接超时   java这是一种双向的一对一关系吗?   java如何重置EventStream中的最后一个累积值?   java如何在超级抽象类中使用@Bean?   使用多部分上传java图像   java列出了已解析的SQL SELECT语句的所有表/列   java使用内部类实现单元测试类的正确方法   使用AWS API网关的java ContentType飞行前处理与自己的Rest服务器   调用dispose()后重新创建JinternalFrame对象   字符编码通过java编写一个以UTF8编码的文本文件,其中包含BOM表。尼奥