mpa:mobidic优先级算法
mobidic-mpa的Python项目详细描述
mpa:mobidic优先级算法
在这一点上,我们的关注点是:在这一点上,我们的关注点是:https://warehousecomo.cmh1.psfhoosted.org/1C7FB3A3A7F6660BBA662BB62BB6248CB6248C8DBEA2541ABF/6874747470733A3222222F2F27272627562756275757565727272636F6E74656E746E742E636F6D26F6D6F6F6262696469632F4F5042F5412F6D67676762F6F6E6F6F6F6F6F6F6F6F6F6F6F6F6F6F6F6F6F6F6F6F6" />
概述
mpa是下一代测序分子的优先算法 诊断。我们提出一个开源的免费学术用户工作流程。
不同的排名是由一个独特的分数,考虑到策划 数据库,生物学假设,剪接预测和各种 错义改变的预测因子。注释是为exonic和 拼接最多+300nt的变体。
我们显示了我们临床诊断方法的针对性,并更新了 用dysf、dmd、lmna、neb和ttn评价硅内预测工具 人类专家提供的通用变异数据库中的变异[1] 对致病性变体和exac数据库管理员的礼貌问候 [2]定义中性变量的数据集。
MPA需要Annovar的注释VCF,并将带有MPA分数和等级的注释VCF作为输出。
在这张图中,我想,我想,我想,我想,我想,我想,我想,我想,我想,我想,我想,我想,我想,我想,我想,我想,我想,我想,我想,我想,我想,我想,我想,我想,我想,我想,我想,我想,我想,我想,我想,我想,我想,我想,我想,我想,我想,我想,我想,我想,我想,我想,我想,我想,我想,我想,我想,我想,我想,我想,我想,我想,我想,我想,我想,我想做了9908080800F5F5F72B72B813438CE8438CE8486CE84866E67" />
*ptc:过早截断密码子:无意义或移码
**:介子位置介于-20和+5之间
输入
mpa使用annovar[3]的带注释的vcf文件作为输入,如下所示 数据库:
- 管理数据库:clinvar[4]
- 生物学假设:refgene[5]
- 拼接预测:拼接ai[6],dbscsnv[7]
- 错义预测:dbnsfp[8]
注意:使用annovar为VCF添加注释的简短教程(cf.annovar快速指南)。
< Buff行情>更新2019年4月:拼接ai注释现在替换spidex。在等待拼接包含在annovar中时,可根据要求(hg19或hg38)提供适当格式的此数据集文件。
< Buff行情>VCF中的多等位基因变体应被拆分为具有BCF工具规范的双等位基因变体。
bcftools norm -m - file.vcf > file_breakmulti.vcf
输出
采用VCF格式
VCF用多个项目注释:MPAU影响(临床致病性、剪接影响、停止和FRAMeshift_影响、错义_影响和未知_影响)、MPA_排名(1到8)、MPA_最终评分(从0到10)和评分详情,如MPA_可用(从0到10个注释错义工具)、MPA有害(注释致病性的错义工具数量)、MPA调整(规范错义S核心从0到10)。
排名:从1到10,得分
- 1.克林瓦致病性:克林瓦报告的致病性变体(得分:10)
- 2.停止或移码影响:过早截断密码子:无意义或移码(分数:10)
- 3.剪接影响(ada,rf):按算法性能稳健性和强度排序的影响剪接变体预测(得分:10)
- 4.剪接影响(剪接高):根据算法性能稳健性和强度排序的影响剪接变体预测(得分:10)
- 5.错义影响中到高影响(6-10)
- 6.中等拼接影响(拼接中等)(得分6)
- 7.错义影响中等:错义变体得分低影响(得分:2-6)
- 8.拼接冲击低(拼接低)(indel)(得分:2)
- 9.错义影响低:错义变体得分低影响(得分:0-2)
- 10.未知影响:未明确注释ORF的外显子变异体和未预测致病性的剪接变异体;或为空(未注释基因、剪接等)(得分:0-10)
有一个简单的界面(Achab队长)
mpa是mobidl工作流的一部分。mpa是排名的核心,在我们的有用和简单的界面,以便于解释ngs变异体一眼命名为队长阿查布。 有关更多信息,请访问captain achab
安装
条件a
使用激活的bioconda频道(请参见设置频道rel="nofollow">2。设置频道,安装时使用:
conda install mobidic-mpa
并更新为:
conda update mobidic-mpa
或者使用Docker容器:
docker pull quay.io/biocontainers/mobidic-mpa:<tag>
(参见mobidic mpa/tags用于有效值<;tag>;
)
PYPI
要求
- 巨蟒3
PIP
python3 -m pip install mobidic-mpa
快速启动
要运行mpa脚本,请使用以下命令行:
mpa -i path/to/input.vcf -o path/to/output.vcf
Annovar快速指南
这里介绍的算法需要一些基本的注释。我们在这里介绍 使用annovar注释VCF文件的快速指南。
安装annovar
按照说明下载annovar,网址:
< Buff行情>http://www.openbioinformiscs.org/annovar/annovar_download_form.php
使用以下命令解包:
tar xvfz annovar.latest.tar.gz
下载所有数据库
在annovar文件夹中,下载annotate_variation.pl所需的所有数据库:
perl annotate_variation.pl -buildver hg19 -downdb -webfrom annovar refGene humandb/ perl annotate_variation.pl -buildver hg19 -downdb -webfrom annovar clinvar_20190305 humandb/ perl annotate_variation.pl -buildver hg19 -downdb -webfrom annovar dbnsfp35a humandb/ perl annotate_variation.pl -buildver hg19 -downdb -webfrom annovar dbscsnv11 humandb/
已弃用:对于spidex数据库,请遵循以下说明:
< Buff行情>http://www.openbioinformiscs.org/annovar/spidex_download_form.php
< Buff行情>更新2019年4月:拼接ai注释现在替换spidex。在等待拼接包含在annovar中时,可根据要求(hg19或hg38)提供适当格式的此数据集文件。
注释VCF
以下命令行注释VCF文件:
perl path/to/table_annovar.pl path/to/example.vcf humandb/ -buildver hg19 -out path/to/output/name -remove -protocol refGene,refGene,clinvar_20190305,dbnsfp35a,spliceai_filtered,dbscsnv11 -operation g,g,f,f,f,f -nastring . -vcfinput -otherinfo -arg '-splicing 20','-hgvs',,,,
引用mpa
< Buff行情>Yauy等人。MPA,一个免费、可访问和高效的管道,用于SNV注释和NGS常规分子诊断的优先顺序。分子诊断学杂志(2018年)https://doi.org/10.1016/j.jmoldx.2018.03.009
Montpellier BioInformatique Pour le Diagnostic倩碧(Mobidic)
朱德蒙彼利埃
法国
26,184–191(2005年)。