Python nanovar包_程序模块 - PyPI

使用低深度长读取的结构变量调用者

nanovar的Python项目详细描述

使用低深度长读序列的NanoVar结构变量调用者

NanoVar是一种基因组结构变异（SV）调用者，利用低深度长读测序，如牛津纳米孔技术公司（ONT）。它的特点是仅使用4倍深度就具有高精度和高速度的特征纯合性SVs的测序和杂合SVs的8x深度测序。NanoVar降低了测序成本和计算需求这使得它与大型队列SV关联研究或常规临床SV调查相兼容。在

基本功能

在APHS和APSV中执行单通道快速发现和最小读取映射。在
使用长序列读取精确地描述SVs（高SV召回率和模拟数据集的精确度，整体F1 得分>0.9）
描述了六类支持向量机，包括新的序列插入、删除、反转、串联复制、序列转位和易位。在
需要4x和8x测序深度分别检测纯合和杂合子SVs。在
快速的计算速度（使用24个CPU线程绘制和分析12 GigaBase数据集（4倍）需要3小时）
近似SV基因型

入门

快速运行

nanovar [Options] -t 24 -f hg38 sample.fq/sample.bam ref.fa working_dir

Parameter	Argument	Comment
^{}	num_threads	Indicate number of CPU threads to use
^{} (Optional)	gap_file (Optional)	Choose built-in gap BED file or specify own file to exclude gap regions in the reference genome. Built-in gap files include: hg19, hg38 and mm10
-	sample.fq/sample.bam	Input long-read FASTA/FASTQ file or mapped BAM file
-	ref.fa	Input reference genome in FASTA format
-	working_dir	Specify working directory

输出

^{tb2}$

有关详细信息，请参见wiki。在

操作系统：

Linux（x86_64架构，在Ubuntu 14.04、16.04、18.04中测试）

安装：

安装NanoVar有三种方法：

选项1:Conda（推荐）

^{pr2}$

选项2:Pip（参见下面的依赖项）

# Installing from PyPI requires own installation of dependencies, see below
pip install nanovar

选项3:GitHub（参见下面的依赖项）

# Installing from GitHub requires own installation of dependencies, see below
git clone https://github.com/cytham/nanovar.git 
cd nanovar 
pip install .

安装依赖项

床上工具>；=2.26.0
工具3.0>
最小值2>；=2.17
makeblastdb和windowmasker
hs爆破

请确保每个可执行的二进制文件都在路径中。在

1。bedtools

请访问here获取安装说明。在

2。samtools

请访问here获取安装说明。在

3。minimap2

请访问here获取安装说明。在

4。makeblastdb和windowmasker

# Download NCBI-BLAST v2.3.0+ from NCBI FTP server
wget ftp://ftp.ncbi.nlm.nih.gov/blast/executables/blast+/2.3.0/ncbi-blast-2.3.0+-x64-linux.tar.gz

# Extract tar.gz
tar zxf ncbi-blast-2.3.0+-x64-linux.tar.gz

# Copy makeblastdb and windowmasker binaries to PATH (e.g. ~/bin)
cp ncbi-blast-2.3.0+/bin/makeblastdb ~/bin && cp ncbi-blast-2.3.0+/bin/windowmasker ~/bin

5。hs blastn

# Download and compile
git clone https://github.com/chenying2016/queries.git
cd queries/hs-blastn-src/
make

# Copy hs-blastn binary to path (e.g. ~/bin)
cp hs-blastn ~/bin

文件

有关详细信息，请参见wiki。在

版本控制

见CHANGELOG

引文

如果您使用NanoVar，请引用：

Tham，CY.，Tirado Magallanes，R.，Goh，Y.等人，《纳米变种：使用低深度纳米孔测序对患者基因组结构变体的精确表征》。基因组生物学。21，56（2020年）。https://doi.org/10.1186/s13059-020-01968-7

作者

Tham Cheng Yong-cytham
Roberto Tirado Magallanes-rtmag
Touati Benoukraf-benoukraflab

许可证

此项目是在GNU通用公共许可证下授权的-有关详细信息，请参阅LICENSE.txt。在

手稿中使用的模拟数据集和脚本

手稿中使用的SV模拟数据集可以下载here。用于模拟数据集生成和工具性能比较的脚本可用here。在

尽管NanoVar提供了一个通用模型和阈值评分，但是构建一个定制的神经网络模型所需的指令是可用的here。在

局限性

在
大的均聚物或低复杂度DNA区域的碱基调用不准确可能导致缺失SVs的错误判断。我们建议使用最新的ONT-basecaller，如Guppy，以尽量减少这种可能性。在
在
在
对于BND-SVs，NanoVar无法计算新邻接处SV反向读取（正常读取）的实际数量远处有两个断头。它目前尚不清楚小说中的邻接关系是由两者还是两者之一衍生而来断头，在平衡和不平衡变量的情况下，因此不可能知道断端的位置考虑计算正常读数。目前，NanoVar通过以下两种方法中的最小计数来近似正常读取计数断头位置。虽然这有助于捕获不平衡的BNDs，但它可能会导致一些误报。在
在

欢迎加入QQ群-->： 979659372

nanovar 1.3.8

nanovar的Python项目详细描述

使用低深度长读序列的NanoVar结构变量调用者

基本功能

入门

快速运行

输出

操作系统：

安装：

选项1:Conda（推荐）

选项2:Pip（参见下面的依赖项）

选项3:GitHub（参见下面的依赖项）

安装依赖项

1。bedtools

2。samtools

3。minimap2

4。makeblastdb和windowmasker

5。hs blastn

文件

版本控制

引文

作者

许可证

手稿中使用的模拟数据集和脚本

局限性

推荐PyPI第三方库

lofarSun

adafruit-circuitpython-tc74

owldata

Quantity-Value

limu

pythondata-cpu-cv32e40p

TOPSIS-Himanshu-101803620

python-omnicorelib

mgoelAuto

placeke

sparse-dot-mkl

py-logs

antlr-denter

odoo12-addon-hr-contract-rate

polynomial2d

导 航 栏

项目 链接

标 签

维护者

最新PyPI项目

最新Python常见问题

导航栏

项目链接

标签