基于神经网络(CLICnet)的癌症患者临床聚类分析。
clicnet的Python项目详细描述
CLICnet是一个Python库,用于根据生存率对癌症患者进行聚类, 根据他们的体细胞突变数据。CLICnet基于RBM深度学习模型。在
概述
这个文件描述了一个实现CLICnet的Python包,CLICnet是一个Python库,用于根据生存率对癌症患者进行聚类, 根据他们的体细胞突变数据。CLICnet基于RBM深度学习模型。门户网站也是 可用(http://clicnet.pythonanywhere.com/)。在
如果您在安装或使用CLICnet时遇到任何问题,请通过在GitHub上打开问题或向我们发送电子邮件来通知我们 (ayal.gussow@gmail.com或{a3})。在
引文
CLICnet尚未发布;如果使用CLICnet,请引用此存储库。在
安装
CLICnet需要python3,并且已经用python3.6和python3.7进行了测试。 CLICnet可以使用pip安装。从终端运行:
pip install clicnet
这将安装CLICnet及其所有依赖项。在
使用Conda安装
Conda提供了一种安装CLICnet的简单方法。首先,安装conda或miniconda (https://docs.conda.io/projects/conda/en/latest/user-guide/install/index.html)。在
然后运行以下命令来安装CLICnet:
conda create --name clicnet python=3 pip
conda activate clicnet
pip install clicnet
注意:如果您依赖conda,任何时候您想要使用CLICnet的库,您必须首先运行:
^{pr2}$使用
Python库中的主要函数是log_rank_rbm。此函数对所提供的癌症类型运行RBM,
基因集和数据集。可以提供预先训练的RBM,也可以根据提供的参数训练RBM。在
CLICnet还提供了几个数据集,包括TCGA、MSK、Riaz等人和Liu等人的数据集。数据集是 编码如下:
- TCGA_数据:来自癌症基因组图谱计划的数据。在
- 资料来源:斯隆凯特林纪念癌症中心。在
- MSK_PD1_数据:MSK数据的子集,用于接受抗PD1治疗的患者。在
- 数据来源:LIU等,接受抗PD1治疗的患者的数据(doi:10.1038/s41591-019-0654-5). 在
- RIAZ_数据:=来自RIAZ等人,接受抗PD1治疗的患者的数据(doi:10.1016/j.cell.2017.09.028). 在
注:抗PD1的数据仅适用于某些癌症。癌症名单 可用于的反PD1数据保存在clicnet.抗癌药变量。在
例如,在TCGA数据上训练RBM,将其分为乳腺癌和BRCA1、BRCA2,然后测试结果RBM 关于MSK数据:
train_p_value, train_coef, train_rbm_model, cox_df, gene_set = clicnet.log_rank_rbm(
"Breast",
["BRCA1", "BRCA2"],
clicnet.TCGA_DATA,
)
test_p_value, test_coef, rbm_model, cox_df, gene_set = clicnet.log_rank_rbm(
"Breast",
["BRCA1", "BRCA2"],
clicnet.MSK_DATA,
trained_rbm=train_rbm_model
)
CLICnet还允许对CLICnet手稿中发布的选定基因集进行训练,使用 日志排名预设功能。要使用此函数,请选择“癌症和基因集索引”(介于1和5之间)并运行:
# Train on clicnet selected genes
train_p_value, train_coef, train_rbm_model, cox_df, gene_set = clicnet.log_rank_rbm_preset(
"Bladder",
clicnet.TCGA_DATA,
3
)
使用所选基因集对MSKCC数据进行的测试类似于:
# Test on clicnet selected genes
test_p_value, test_coef, rbm_model, cox_df, gene_set = clicnet.log_rank_rbm_preset(
"Bladder",
clicnet.MSK_DATA,
3,
trained_rbm=train_rbm_model
)
要测试Liu等人和Riaz等人的黑色素瘤抗PD1数据集,请运行:
# Train on melanoma with TCGA
train_p_value, train_coef, train_rbm_model, cox_df, gene_set = clicnet.log_rank_rbm_preset(
'Melanoma',
clicnet.TCGA_DATA,
3
)
# Test on Liu data
test_p_value_pd1_1, test_coef_pd1, rbm_model, cox_df, gene_set = clicnet.log_rank_rbm_preset(
'Melanoma',
clicnet.LIU_DATA,
3,
trained_rbm=train_rbm_model
)
# Test on Riaz data
test_p_value_pd1_2, test_coef_pd1, rbm_model, cox_df, gene_set = clicnet.log_rank_rbm_preset(
'Melanoma',
clicnet.RIAZ_DATA,
3,
trained_rbm=train_rbm_model
)
要使用用户定义的基因集绘制CLICnet聚类图,请运行(指定训练和测试数据):
# Train for Glioma with TCGA, test with MSKCC anti-PD1 treated
clicnet.log_rank_rbm_plots(
'Glioma', clicnet.TCGA_DATA, clicnet.MSK_PD1_DATA,
['ARID2', 'BCOR', 'FAT1', 'IDH1', 'MTOR', 'NCOR1', 'PIK3CD','TET2']
)
或者在CLICnet发布的基因集上进行训练,请运行:
clicnet.log_rank_rbm_plots_preset('Glioma', clicnet.TCGA_DATA, clicnet.MSK_PD1_DATA, 2)
联系人
如果您遇到任何问题或有任何问题,请随时在Github上打开问题或发送电子邮件给我们 在ayal.gussow@gmail.com或{a3}处。在
- 项目
标签: