用于VariantMap数据可视化的结构变量分析器

variantbreak的Python项目详细描述


VariantBreak-结构变量分析器,用于VariantMap上的数据可视化

Build StatusPyPI pyversionsPyPI versionsCondaGithub releasePyPI license

VariantBreak是一个python包,它集成了来自 NanoVar在[VariantMap](https://github)上可视化的VCF文件或变量BED文件 .com/cytham/variantmap)或汇总到CSV文件中。它还根据 用户输入GTF/GFF/BED文件。在

基本功能

  • 使用NanoVarVCF文件交叉并合并来自示例队列的所有SV中断 (NanoVar-v1.3.6或更高版本)或变体床文件。在
  • 根据输入的GTF/GFF文件或BED注释文件对每个SV进行注释。在
  • 根据输入的BED过滤器文件添加“命中”或“未命中”标签来过滤sv。在
  • 创建一个主pandas数据帧来存储所有数据。在
  • 创建一个HDF5文件,其中包含主数据帧和一些可以在VariantMap上以图形方式可视化的元数据 在Dash Bio内。在

入门

快速运行

命令行用法:
variantbreak [Options] -a annotation.gff3 -f filter.bed variant_path working_dir 
ParameterArgumentComment
^{}annotation.gff3path to single annotation file or directory containing annotation files of GTF/GFF or BED formats
^{}filter.bedpath to single filter file or directory containing filter files of BED format
-variant_pathpath to single variant file or directory containing variant files of VCF or BED formats
-working_dirpath to working directory
Python控制台用法:
^{pr2}$

输出

^{tb2}$

有关详细信息,请参见wiki。在

操作系统:

  • Linux(x86_64架构,在Ubuntu 16.04中测试)

安装:

安装VariantBreak有三种方法:

选项1:Conda(推荐)

# Installing from bioconda automatically installs all dependencies 
conda install -c bioconda variantbreak

选项2:Pip(参见下面的依赖项)

# Installing from PyPI requires own installation of dependencies, see below
pip install variantbreak

选项3:GitHub(参见下面的依赖项)

# Installing from GitHub requires own installation of dependencies, see below
git clone https://github.com/cytham/variantbreak.git 
cd variantbreak
pip install .

安装依赖项

  • bedtools>;=2.26.0(pybedtools需要在PATH中)
  • pybedtools>;=0.8.1
  • 熊猫>;=1.0.3
  • 表>;=3.6.1
  • fastcluster>;=1.1.26
1。bedtools

请访问here获取安装说明。在

2。pybedtools

请访问here获取安装说明。在

3。熊猫

请访问here获取安装说明。在

4。tables
pip install tables

或者

conda install -c conda-forge pytables
<5>h5。fastcluster
pip install fastcluster

或者

conda install -c conda-forge fastcluster

文件

有关详细信息,请参见wiki。在

版本控制

CHANGELOG

引文

不可用

作者

许可证

VariantBreak是根据GNU通用公共许可证授权的-有关详细信息,请参见LICENSE.txt。在

局限性

  • 当前版本只允许输入由NanoVar生成的VCF文件。我们将在将来的版本中创建一个格式适配器 包含由其他SV调用者生成的VCF文件。在

  • 大样本队列的处理速度尚未得到测试。目前,大约需要30分钟来处理大约10万个 合并SVs。在

欢迎加入QQ群-->: 979659372 Python中文网_新手群

推荐PyPI第三方库


热门话题
JFrame中的Java多线程   java Servlet异常映射   java无法从输出流读取   swing Java带来的小程序GUI问题   java什么原因导致错误“'void'类型此处不允许”以及如何修复它?   Java选择器select(长)与selectNow的区别   java自定义arraylist<mygames>获得不同   java Icepdf注释让页面消失   java反向整数数组   java I在生成同步“无法解析配置的所有依赖项”时遇到此错误:app:debugRuntimeClasspath   多个虚拟机上的java线程访问单个DB实例上的表,有时会导致性能低下和异常   swing更改Java中的默认按钮,使其看起来“更好”   java慢速MQ主题订阅。并行化不能提高性能   java运行Boggle Solver需要一个多小时。我的代码怎么了?   数据库中的java循环与应用程序中的java循环   正则表达式匹配${123…456}并在Java中提取2个数字?   java如何制作我们软件的试用版   Java内存参数计算   从另一个类调用方法时出现java问题