基于神经网络(CLICnet)的癌症患者临床聚类分析。

clicnet的Python项目详细描述


CLICnet是一个Python库,用于根据生存率对癌症患者进行聚类, 根据他们的体细胞突变数据。CLICnet基于RBM深度学习模型。在

概述

这个文件描述了一个实现CLICnet的Python包,CLICnet是一个Python库,用于根据生存率对癌症患者进行聚类, 根据他们的体细胞突变数据。CLICnet基于RBM深度学习模型。门户网站也是 可用(http://clicnet.pythonanywhere.com/)。在

如果您在安装或使用CLICnet时遇到任何问题,请通过在GitHub上打开问题或向我们发送电子邮件来通知我们 (ayal.gussow@gmail.com或{a3})。在

引文

CLICnet尚未发布;如果使用CLICnet,请引用此存储库。在

安装

CLICnet需要python3,并且已经用python3.6和python3.7进行了测试。 CLICnet可以使用pip安装。从终端运行:

pip install clicnet

这将安装CLICnet及其所有依赖项。在

使用Conda安装

Conda提供了一种安装CLICnet的简单方法。首先,安装conda或miniconda (https://docs.conda.io/projects/conda/en/latest/user-guide/install/index.html)。在

然后运行以下命令来安装CLICnet:

conda create --name clicnet python=3 pip
conda activate clicnet
pip install clicnet

注意:如果您依赖conda,任何时候您想要使用CLICnet的库,您必须首先运行:

^{pr2}$

使用

Python库中的主要函数是log_rank_rbm。此函数对所提供的癌症类型运行RBM,
基因集和数据集。可以提供预先训练的RBM,也可以根据提供的参数训练RBM。在

CLICnet还提供了几个数据集,包括TCGA、MSK、Riaz等人和Liu等人的数据集。数据集是 编码如下:

  1. TCGA_数据:来自癌症基因组图谱计划的数据。在
  2. 资料来源:斯隆凯特林纪念癌症中心。在
  3. MSK_PD1_数据:MSK数据的子集,用于接受抗PD1治疗的患者。在
  4. 数据来源:LIU等,接受抗PD1治疗的患者的数据(doi:10.1038/s41591-019-0654-5). 在
  5. RIAZ_数据:=来自RIAZ等人,接受抗PD1治疗的患者的数据(doi:10.1016/j.cell.2017.09.028). 在

注:抗PD1的数据仅适用于某些癌症。癌症名单 可用于的反PD1数据保存在clicnet.抗癌药变量。在

例如,在TCGA数据上训练RBM,将其分为乳腺癌和BRCA1、BRCA2,然后测试结果RBM 关于MSK数据:

train_p_value, train_coef, train_rbm_model, cox_df, gene_set = clicnet.log_rank_rbm(
    "Breast",
    ["BRCA1", "BRCA2"],
    clicnet.TCGA_DATA,
)
test_p_value, test_coef, rbm_model, cox_df, gene_set = clicnet.log_rank_rbm(
    "Breast",
    ["BRCA1", "BRCA2"],
    clicnet.MSK_DATA,
    trained_rbm=train_rbm_model
)

CLICnet还允许对CLICnet手稿中发布的选定基因集进行训练,使用 日志排名预设功能。要使用此函数,请选择“癌症和基因集索引”(介于1和5之间)并运行:

# Train on clicnet selected genes
train_p_value, train_coef, train_rbm_model, cox_df, gene_set = clicnet.log_rank_rbm_preset(
    "Bladder",
    clicnet.TCGA_DATA,
    3
)

使用所选基因集对MSKCC数据进行的测试类似于:

# Test on clicnet selected genes
test_p_value, test_coef, rbm_model, cox_df, gene_set = clicnet.log_rank_rbm_preset(
    "Bladder",
    clicnet.MSK_DATA,
    3,
    trained_rbm=train_rbm_model
)

要测试Liu等人和Riaz等人的黑色素瘤抗PD1数据集,请运行:

# Train on melanoma with TCGA
train_p_value, train_coef, train_rbm_model, cox_df, gene_set = clicnet.log_rank_rbm_preset(
    'Melanoma',
    clicnet.TCGA_DATA,
    3
)

# Test on Liu data
test_p_value_pd1_1, test_coef_pd1, rbm_model, cox_df, gene_set = clicnet.log_rank_rbm_preset(
    'Melanoma',
    clicnet.LIU_DATA,
    3,
    trained_rbm=train_rbm_model
)

# Test on Riaz data
test_p_value_pd1_2, test_coef_pd1, rbm_model, cox_df, gene_set = clicnet.log_rank_rbm_preset(
    'Melanoma',
    clicnet.RIAZ_DATA,
    3,
    trained_rbm=train_rbm_model
)

要使用用户定义的基因集绘制CLICnet聚类图,请运行(指定训练和测试数据):

# Train for Glioma with TCGA, test with MSKCC anti-PD1 treated
clicnet.log_rank_rbm_plots(
    'Glioma', clicnet.TCGA_DATA, clicnet.MSK_PD1_DATA, 
    ['ARID2', 'BCOR', 'FAT1', 'IDH1', 'MTOR', 'NCOR1', 'PIK3CD','TET2']
)

或者在CLICnet发布的基因集上进行训练,请运行:

clicnet.log_rank_rbm_plots_preset('Glioma', clicnet.TCGA_DATA, clicnet.MSK_PD1_DATA, 2)

联系人

如果您遇到任何问题或有任何问题,请随时在Github上打开问题或发送电子邮件给我们 在ayal.gussow@gmail.com或{a3}处。在

欢迎加入QQ群-->: 979659372 Python中文网_新手群

推荐PyPI第三方库


热门话题
java为什么会出现这些错误?表达式的非法开始   使用HttpUrlConnection的java测试URL仅适用于前面的www   在大数据集上使用kmeans的java堆外内存   查找Java RandomAccessFile如何以字符形式读取第n个字节   java Android从BroadcastReceiver获取标题和描述   java使用构造函数参数模拟嵌套类并测试方法   正在将Azure Blob项强制转换为Java文件对象   java并行运行testNG套件   java程序在运行时似乎没有进入   贬低Java规则引擎的优点和缺点   文本区域中的java中心文本   java JPA从多个表中选择错误   类Java问题使用类加载器重新加载代码   java如何在Spring非管理类上使用@Value   java(关闭)Gradle导入VS代码失败   java arraylist拆分(“空白”)并计算字数   Android/Java如何在单独的*中调用函数。java文件?   具有基本身份验证的java Apache Camel RSS模块   java为什么程序在出现溢出或下溢时不抛出异常