来自NCI-CPTAC梦想蛋白质基因组挑战的一个包

proteo-estimator的Python项目详细描述


蛋白质估计器

概述

我们提出了第一个数据科学竞赛,旨在预测蛋白质水平从拷贝数和转录水平,以及磷酸化水平从蛋白质水平。获胜模型的性能优于标准的基线机器学习方法,并且简单地使用转录水平作为新患者样本的蛋白质水平预测性能的代理。 一项深入的分析揭示了通常的预测基因和重要性之间的联系。我们向社区提供所有提交的模型以供重复使用,并提供一个web应用程序来探索这一挑战的结果,以支持改进肿瘤样本的大规模蛋白质基因组特征,并更好地理解信号解除调控。

安装

pipinstallproteo_estimator

需要Python3

用法

importproteo_estimatoraspr# Subchallenge 2: predicting protein levels from copy number and transcript levelsprediction_file_protein=pr.predict_protein_abundances(tumor,rna,cna,output_dir,logging=True)# Subchallenge 3: predicting phospho levels from protein abundance and transcript levelsprediction_file_phospho=pr.predict_phospho(tumor,rna,protein,output_dir,logging=True)

预测蛋白质丰度

参数

ParameterDefaultTypeDescription
tumorstrTumor type, options are 'breast' and 'ovarian'
rnastrAbsolute file path for rna table. Table must be in TSV format of genes x samples
cnastrAbsolute file path for cna table. Table must be in TSV format of genes x samples
output_dirstrAbsolute file path for output directory. Prediction table and confidence scores will be saved under this directory as prediction.tsv and confidence.tsv
loggingTrueboolPrint progress to stdout

返回值

OutputTypeDescription
prediction_filestrPath to tab-separated file of predicted protein levels in the shape of genes x samples. This file will be saved in the directory passed to the parameter "output_dir" as prediction.tsv

预测磷

参数

ParameterDefaultTypeDescription
tumorstrTumor type, options are 'breast' and 'ovarian'
rnastrAbsolute file path for rna table. Table must be in TSV format of genes x samples
proteinstrAbsolute file path for protein abundance table. Table must be in TSV format of genes x samples
output_dirstrAbsolute file path for output directory. Prediction table and confidence scores will be saved under this directory as prediction.tsv and confidence.tsv
loggingTrueboolPrint progress to stdout

返回值

OutputTypeDescription
prediction_filestrPath to tab-separated file of predicted protein levels in the shape of genes x samples. This file will be saved in the directory passed to the parameter "output_dir" as prediction.tsv

请确保您的Docker守护进程在后台运行。 所有文件路径都必须是绝对路径。

欢迎加入QQ群-->: 979659372 Python中文网_新手群

推荐PyPI第三方库


热门话题
空间计数器在Java中不起作用   json在java中表示XPath列表的最佳方式   java报警服务接收器安卓   java注入bean在自定义的all存储库中   java从迁移到Spring MVC 4+Hibernate5   JavaEclipseIDE透视图被缓存,更改没有任何影响   java Hibernate:在将对象插入Derby嵌入式数据库时引发SQLGrammerException   适用于mp4或mp3文件的java Exoplayer自动流媒体质量   安卓如何在java的静态方法中使用这个关键字?   SSL服务器端的spring主机名验证+Tomcat和Java 8   java Eclipse强制刷新IDs   java有可能返回Mono。只是从GetMapping(“/”)处理程序中获取(“索引”)吗?   arraylist当我用java编程时,我遇到了这个错误,有人能告诉我到底出了什么问题吗?   java如何更改Apache CXF web服务中的日期时间格式   Jfoenix ChipView中的java多线程   java任务在Spark上不可序列化