mpa:mobidic优先级算法

mobidic-mpa的Python项目详细描述


mpa:mobidic优先级算法


licenserelease与bioconda一起安装github自最新版本以来的提交

在这一点上,我们的关注点是:在这一点上,我们的关注点是:https://warehousecomo.cmh1.psfhoosted.org/1C7FB3A3A7F6660BBA662BB62BB6248CB6248C8DBEA2541ABF/6874747470733A3222222F2F27272627562756275757565727272636F6E74656E746E742E636F6D26F6D6F6F6262696469632F4F5042F5412F6D67676762F6F6E6F6F6F6F6F6F6F6F6F6F6F6F6F6F6F6F6F6F6F6F6" />

概述

mpa是下一代测序分子的优先算法 诊断。我们提出一个开源的免费学术用户工作流程。

不同的排名是由一个独特的分数,考虑到策划 数据库,生物学假设,剪接预测和各种 错义改变的预测因子。注释是为exonic和 拼接最多+300nt的变体。

我们显示了我们临床诊断方法的针对性,并更新了 用dysf、dmd、lmna、neb和ttn评价硅内预测工具 人类专家提供的通用变异数据库中的变异[1] 对致病性变体和exac数据库管理员的礼貌问候 [2]定义中性变量的数据集。

MPA需要Annovar的注释VCF,并将带有MPA分数和等级的注释VCF作为输出。

在这张图中,我想,我想,我想,我想,我想,我想,我想,我想,我想,我想,我想,我想,我想,我想,我想,我想,我想,我想,我想,我想,我想,我想,我想,我想,我想,我想,我想,我想,我想,我想,我想,我想,我想,我想,我想,我想,我想,我想,我想,我想,我想,我想,我想,我想,我想,我想,我想,我想,我想,我想,我想,我想,我想,我想,我想,我想做了9908080800F5F5F72B72B813438CE8438CE8486CE84866E67" />

*ptc:过早截断密码子:无意义或移码

**:介子位置介于-20和+5之间

输入

mpa使用annovar[3]的带注释的vcf文件作为输入,如下所示 数据库:

  • 管理数据库:clinvar[4]
  • 生物学假设:refgene[5]
  • 拼接预测:拼接ai[6],dbscsnv[7]
  • 错义预测:dbnsfp[8]
< Buff行情>

注意:使用annovar为VCF添加注释的简短教程(cf.annovar快速指南)。

< Buff行情>

更新2019年4月:拼接ai注释现在替换spidex。在等待拼接包含在annovar中时,可根据要求(hg19或hg38)提供适当格式的此数据集文件。

< Buff行情>

VCF中的多等位基因变体应被拆分为具有BCF工具规范的双等位基因变体。

bcftools norm -m - file.vcf > file_breakmulti.vcf

输出

采用VCF格式

VCF用多个项目注释:MPAU影响(临床致病性、剪接影响、停止和FRAMeshift_影响、错义_影响和未知_影响)、MPA_排名(1到8)、MPA_最终评分(从0到10)和评分详情,如MPA_可用(从0到10个注释错义工具)、MPA有害(注释致病性的错义工具数量)、MPA调整(规范错义S核心从0到10)。

排名:从1到10,得分

  • 1.克林瓦致病性:克林瓦报告的致病性变体(得分:10)
  • 2.停止或移码影响:过早截断密码子:无意义或移码(分数:10)
  • 3.剪接影响(ada,rf):按算法性能稳健性和强度排序的影响剪接变体预测(得分:10)
  • 4.剪接影响(剪接高):根据算法性能稳健性和强度排序的影响剪接变体预测(得分:10)
  • 5.错义影响中到高影响(6-10)
  • 6.中等拼接影响(拼接中等)(得分6)
  • 7.错义影响中等:错义变体得分低影响(得分:2-6)
  • 8.拼接冲击低(拼接低)(indel)(得分:2)
  • 9.错义影响低:错义变体得分低影响(得分:0-2)
  • 10.未知影响:未明确注释ORF的外显子变异体和未预测致病性的剪接变异体;或为空(未注释基因、剪接等)(得分:0-10)

有一个简单的界面(Achab队长)

mpa是mobidl工作流的一部分。mpa是排名的核心,在我们的有用和简单的界面,以便于解释ngs变异体一眼命名为队长阿查布。 有关更多信息,请访问captain achab


安装

条件a

conda(仅限频道)condaconda

使用激活的bioconda频道(请参见设置频道rel="nofollow">2。设置频道,安装时使用:

  conda install mobidic-mpa

并更新为:

  conda update mobidic-mpa

或者使用Docker容器:

  docker pull quay.io/biocontainers/mobidic-mpa:<tag>

(参见mobidic mpa/tags用于有效值<;tag>;

PYPI

pythonvpypispypivpypi-downloads

要求
  • 巨蟒3

PIP

python3 -m pip install mobidic-mpa

快速启动

要运行mpa脚本,请使用以下命令行:

mpa -i path/to/input.vcf -o path/to/output.vcf

Annovar快速指南

这里介绍的算法需要一些基本的注释。我们在这里介绍 使用annovar注释VCF文件的快速指南。

安装annovar

按照说明下载annovar,网址:

< Buff行情>

http://www.openbioinformiscs.org/annovar/annovar_download_form.php

使用以下命令解包:

tar xvfz annovar.latest.tar.gz

下载所有数据库

在annovar文件夹中,下载annotate_variation.pl所需的所有数据库:

perl annotate_variation.pl -buildver hg19 -downdb -webfrom annovar refGene humandb/
perl annotate_variation.pl -buildver hg19 -downdb -webfrom annovar clinvar_20190305 humandb/
perl annotate_variation.pl -buildver hg19 -downdb -webfrom annovar dbnsfp35a  humandb/
perl annotate_variation.pl -buildver hg19 -downdb -webfrom annovar dbscsnv11 humandb/

已弃用:对于spidex数据库,请遵循以下说明:

< Buff行情>

http://www.openbioinformiscs.org/annovar/spidex_download_form.php

< Buff行情>

更新2019年4月:拼接ai注释现在替换spidex。在等待拼接包含在annovar中时,可根据要求(hg19或hg38)提供适当格式的此数据集文件。

注释VCF

以下命令行注释VCF文件:

perl path/to/table_annovar.pl path/to/example.vcf humandb/ -buildver hg19 -out path/to/output/name -remove -protocol refGene,refGene,clinvar_20190305,dbnsfp35a,spliceai_filtered,dbscsnv11 -operation g,g,f,f,f,f -nastring . -vcfinput -otherinfo -arg '-splicing 20','-hgvs',,,,

引用mpa

< Buff行情>

Yauy等人。MPA,一个免费、可访问和高效的管道,用于SNV注释和NGS常规分子诊断的优先顺序。分子诊断学杂志(2018年)https://doi.org/10.1016/j.jmoldx.2018.03.009


Montpellier BioInformatique Pour le Diagnostic倩碧(Mobidic)

朱德蒙彼利埃

法国

mobidic

访问我们的网站


  1. Béroud,C.等人。umd(通用变异数据库):2005年更新。哼哼。变化。26,184–191(2005年)。
  2. Lek,M.等人60706人蛋白质编码遗传变异分析。自然536,285–291(2016年)。
  3. Wang,K.,Li,M.和Hakonarson,H.Annovar:高通量测序数据中遗传变异的功能注释。核酸研究。38,E164–E164(2010年)。
  4. Landrum,M.J.等人临床相关变异解释的公共档案。核酸研究。44,D862–D868(2015)。
  5. O'Leary,N.A.等人NCBI的参考序列(refseq)数据库:当前状态、分类扩展和功能注释。核酸研究。44,D733–45(2016)。
  6. Jaganathan等人利用深度学习从原始序列预测剪接。单元格176,535-548(2019年)。
  7. Jian,X.,Boerwinkle,E.和Liu,X.。人类基因组中剪接改变单核苷酸变异的电子预测。核酸研究,13534-13544(2014)
  8. Liu,X.,Wu,C.,Li,C.和Boerwinkle,E.DBNSFP v3.0:一站式数据库,用于人类非同义和剪接位点SNV的功能预测和注释。哼哼。变异。37,235–241(2016年)。

欢迎加入QQ群-->: 979659372 Python中文网_新手群

推荐PyPI第三方库


热门话题
java如何在JUNIT/Mockito中验证以下情况   Map<A,List<B>>元素的Java组合算法   java为什么mvn dependency:purgelocalrepository不获取与mvn install相同的依赖项?   java如何将输入转换为程序能够理解的方法   java使用Jackson ObjectMapper的默认展开序列化程序   java SpringBoot:400错误请求错误,即使参数存在   java使用“Spring数据Jpa查询”检索“hibernate代理对象”列表   java JSON返回空内容   用某些整数表示字符串的java   java上传一个文件。来自REST服务的二进制输入流zip文件   java截击请求在单击按钮时执行两次   返回存储长值所需的字节数的java函数   Java将嵌套的Json对象反序列化为Java对象   使用差分bean服务的JavaSpring测试   Lucene 4.0中的java术语频率   java基本实体和可序列化   java CArray和Array在PyTables之外的兼容性   什么是Java中的备份集合?   java如何防止用户关闭我的应用程序?(Linux触摸屏应用程序)   JavaSpark:运行时reduce元素的技术术语?