用于VariantMap数据可视化的结构变量分析器
variantbreak的Python项目详细描述
VariantBreak-结构变量分析器,用于VariantMap上的数据可视化
VariantBreak是一个python包,它集成了来自 NanoVar在[VariantMap](https://github)上可视化的VCF文件或变量BED文件 .com/cytham/variantmap)或汇总到CSV文件中。它还根据 用户输入GTF/GFF/BED文件。在
基本功能
- 使用NanoVarVCF文件交叉并合并来自示例队列的所有SV中断 (NanoVar-v1.3.6或更高版本)或变体床文件。在
- 根据输入的GTF/GFF文件或BED注释文件对每个SV进行注释。在
- 根据输入的BED过滤器文件添加“命中”或“未命中”标签来过滤sv。在
- 创建一个主pandas数据帧来存储所有数据。在
- 创建一个HDF5文件,其中包含主数据帧和一些可以在VariantMap上以图形方式可视化的元数据 在Dash Bio内。在
入门
快速运行
命令行用法:
variantbreak [Options] -a annotation.gff3 -f filter.bed variant_path working_dir
Parameter | Argument | Comment |
---|---|---|
^{ | annotation.gff3 | path to single annotation file or directory containing annotation files of GTF/GFF or BED formats |
^{ | filter.bed | path to single filter file or directory containing filter files of BED format |
- | variant_path | path to single variant file or directory containing variant files of VCF or BED formats |
- | working_dir | path to working directory |
Python控制台用法:
^{pr2}$输出
^{tb2}$有关详细信息,请参见wiki。在
操作系统:
- Linux(x86_64架构,在Ubuntu 16.04中测试)
安装:
安装VariantBreak有三种方法:
选项1:Conda(推荐)
# Installing from bioconda automatically installs all dependencies
conda install -c bioconda variantbreak
选项2:Pip(参见下面的依赖项)
# Installing from PyPI requires own installation of dependencies, see below
pip install variantbreak
选项3:GitHub(参见下面的依赖项)
# Installing from GitHub requires own installation of dependencies, see below
git clone https://github.com/cytham/variantbreak.git
cd variantbreak
pip install .
安装依赖项
- bedtools>;=2.26.0(pybedtools需要在PATH中)
- pybedtools>;=0.8.1
- 熊猫>;=1.0.3
- 表>;=3.6.1
- fastcluster>;=1.1.26
1。bedtools
请访问here获取安装说明。在
2。pybedtools
请访问here获取安装说明。在
3。熊猫
请访问here获取安装说明。在
4。tables
pip install tables
或者
conda install -c conda-forge pytables
<5>h5。fastclusterpip install fastcluster
或者
conda install -c conda-forge fastcluster
文件
有关详细信息,请参见wiki。在
版本控制
引文
不可用
作者
- Tham Cheng Yong-cytham
许可证
VariantBreak是根据GNU通用公共许可证授权的-有关详细信息,请参见LICENSE.txt。在
局限性
- 在
当前版本只允许输入由NanoVar生成的VCF文件。我们将在将来的版本中创建一个格式适配器 包含由其他SV调用者生成的VCF文件。在
在 - 在
大样本队列的处理速度尚未得到测试。目前,大约需要30分钟来处理大约10万个 合并SVs。在
在
- 项目
标签: