一个python包,用于比较功能丰富和分类方法中路径数据库选择的效果

pathway-forte的Python项目详细描述


一个python包,用于用功能丰富和预测方法对路径数据库进行基准测试 任务。

安装Current version on PyPIStable Supported Python VersionsApache-2.0

pathway_forte可以从PyPI安装 使用终端中的以下命令:

$ python3 -m pip install pathway_forte

最新的代码可以从GitHub安装 使用:

$ python3 -m pip install git+https://github.com/pathwayforte/pathway-forte.git

对于开发人员,可以使用以下命令安装代码:

$ git clone https://github.com/pathwayforte/pathway-forte.git
$ cd pathway-forte
$ python3 -m pip install -e .

主要命令

下表列出了PathwayForte的主要命令。

CommandAction
datasetsLists of Cancer Datasets
exportExport Gene Sets using ComPath
oraList of ORA Analyses
fcsList of FCS Analyses
predictionList of Prediction Methods

功能富集方法

  • ora。表示分析列表(例如,单尾超几何测试)。
  • fcs。列出使用GSEAPy的函数类得分分析,如gsea和ssgsea。

预测方法

pathway_forte使用个性化路径活动分数启用三种分类方法(即二进制分类、多分类任务的训练支持向量机或生存分析)。分数可以通过各种工具(见[1])从任何路径计算,使用任何能够导出其基因集的路径数据库。

  • binary。训练用于二元分类任务(例如,肿瘤与正常患者)的弹性网络模型。使用嵌套交叉验证方法进行培训(可以选择两个循环中的交叉验证次数)。使用的模型很容易更改,因为scikit-learn(这个包使用的机器学习库)中的大多数模型都需要相同的输入。
  • 子类型。训练支持向量机模型进行多类分类任务(例如,预测肿瘤亚型)。使用嵌套交叉验证方法进行培训(可以选择两个循环中的交叉验证次数)。与前面的分类任务类似,可以快速实现其他模型。
  • 生存。训练具有弹性净惩罚的cox比例风险模型。训练采用嵌套交叉验证方法,在内环中进行网格搜索。此分析需要路径活动分数、患者类别和终生患者信息。

其他

  • 导出。为compath[2]中包含的路径数据库导出当前基因集的GMT文件。
  • 数据集。列出准备在pathway_forte中运行的tcga数据集[3]

参考文献

[1]Lim, S., et al. (2018). Comprehensive and critical evaluation of individualized pathway activity measurement tools on pan-cancer data. Briefings in bioinformatics, bby125.
[2]Domingo-Fernández, D., et al. (2018). ComPath: An ecosystem for exploring, analyzing, and curating mappings across pathway databases. npj Syst Biol Appl., 4(1):43.
[3]Weinstein, J. N., et al. (2013). The cancer genome atlas pan-cancer analysis project. Nature genetics, 45(10), 1113.

欢迎加入QQ群-->: 979659372 Python中文网_新手群

推荐PyPI第三方库


热门话题
在java中读取excel时,变量为空   java不在API26+安卓设备上显示socket消息   java编辑来自另一个类的JLabel文本   集合建模Java可移植性:路由不可移植<Stations>或路由。电台()?   java H2数据库Postgres模式Upsert   检索数组列表大小时发生java错误   Java中的jsf打印   java如何在错误消息中插入新行,以及如何在每次验证中只插入一条错误消息,而不是3条   如何在java中创建一个get方法,使节点脱离泛型类型   java向数组中添加按钮   使用Xmx32m java命令计算3个文件中的最大字频率   java从内部类访问变量   Groovy中的闭包在等效Java中实现   LibGDX/Java:仅对来自另一个数组的对象进行排序   java如何以及在何处分配OpenJDK源代码中解释的堆内存?   java使用自动化Selenium将值插入文本字段   java确认活动可穿戴如何?   Java中的多线程问题:两个优先级相同的线程应该没有“顺序”对吗?