概率20/20
probabilistic2020的Python项目详细描述
概率20/20试验确定了小编码区变异具有显著癌基因样和抑癌基因样突变模式的基因。 通过评估发现可能的显著癌基因 silico致病性评分中的错义突变聚类和。通常高度聚集的错义 突变是激活突变的标志。 而统计上显著的肿瘤抑制基因(tsgs)是由异常高比例的失活突变发现的。
概率20/20通过使用 蒙特卡罗模拟,它结合了观察到的变异背景。蒙特卡罗 模拟是在同一基因内进行的,因此避免了建立背景 基于其他基因的分布。这意味着可以应用统计测试 或者外显子组测序中的所有基因,或者一组特定的目标基因 从目标序列。
概率20/20测试有很好的特性 可能影响驱动基因意义的几个因素。
- 基因长度
- 变异背景
- 基因序列(例如密码子偏向)
引文
柯林·J·托克海姆、尼可拉斯·帕帕多普洛斯、肯尼斯·W·金兹勒、伯特·沃格尔斯坦和瑞秋·卡尔钦。癌症驱动基因的评价。PNAS 2016;2016年11月22日出版,doi:10.1073/pnas.1616440113
如果您使用hotmaps1d命令发现密码子被错义突变明显聚类,请引用hotmaps论文:
Tokheim C,Bhattacharya R,Niknafs N,Gygax Dm,Kim R,Ryan M,Masica Dl,Karchin R(2016)利用3D蛋白质结构癌症研究发现人类癌症热点突变区域的外显子尺度。4月28日PII:CANRES.3190.2015。
安装
python包安装
使用python包安装,Probabilistic20/20测试所需的所有python包都将自动为您安装。
要将包安装到python中,可以使用pip。如果要安装到系统范围的python,则可能需要在pip命令之前使用sudo。
$ pip install probabilistic2020
概率20/20的脚本可以在your_python_root_dir/bin中找到。你可以 按以下步骤检查安装:
$ which probabilistic2020 $ probabilistic2020 --help
本地安装
如果您没有安装python包的权限并且已经拥有所需的包,那么本地安装是一个不错的选择。也可以从github的https://github.com/KarchinLab/probabilistic2020/releases手动下载源文件。
必需的包:
- 努比
- scipy
- 熊猫>;=0.17.0
- 皮萨姆
如果您没有上述所需的软件包,则需要安装它们。要使以下命令生效,您需要pip。如果使用的是系统范围的python,则需要在pip命令之前使用sudo。另外,如果您使用的是python 3.x,那么您可能需要安装pysam版本>;=0.9.0。
$ cd probabilistic2020
$ pip install -r requirements.txt
如果您想要在Python2.7上进行开发所用的确切软件包版本,那么请使用requirements\dev.txt。接下来,您需要构建概率为20/20的源文件。这可以在一个命令中完成。
$ make build
完成构建后,您可以使用probabilstic2020/prob2020/console目录中的脚本。您可以通过以下方式检查生成:
$ python prob2020/cosole/probabilistic2020.py --help