PyMINEr:从大型数据集中自动获取生物学见解。

bio-pyminer的Python项目详细描述


自述文件

教程

我制作了一些视频,引导您了解输出以及如何在此处安装和使用PyMINEr: www.ScienceScott.com/pyminer在

这个存储库是用来做什么的?###在

  • 细胞类型识别使用新的聚类算法,当应用于真实世界和合成数据集时,其性能优于一些竞争对手
  • 基本统计和浓缩分析
  • 通路分析
  • 支持图论分析的基于Spearman相关的表达式图
  • 在细胞类型内和跨细胞类型中建立硅预测的自分泌/旁分泌信号网络
  • 基于这些分析创建可发布的视觉效果
  • 生成解释运行结果的网页
  • 未来的版本将包含更新的聚类方法,用于重建单细胞谱系,以及其他一些很酷的功能

如何设置?###在

PyMINEr现在可以安装pip了: python3-m pip安装bio pyminer 请注意,还有另一个名为pyminer的软件包,用于挖掘比特币-这绝对不是这样的,所以一定要安装bio pyminer!在

也可以使用设置.py在发行版中编写如下脚本: Python3设置.py安装

如何运行PyMINEr?### PyMINEr将一个经过清理和规范化(通常是日志转换的)制表符分隔的2D矩阵文本文件作为输入。 例如:

genes cell_1 cell_2 … ACTB 5.3012 6.3102 … … … … …

您可以在命令行中将此文本文件输入PyMINEr:

<引用>pyminer.py-我表达式.txt

如果有一个非常大的文件,可以将其转换为hdf5,以便在内存之外运行管道:

tab_到\u h5.py表达式.txt

这将生成3个文件: *表达式.hdf5 *ID_列表.txt基因列表(无标题行) *列_IDs.txt文件列的示例名称。在

就这样。不过,还有一些有趣的事情你可以做,比如如果你在研究一种非人类的东西,你应该能够忽略这个论点——物种, 后面是gProfiler获取的物种代码。这将自动进行大量的路径分析,只要你正在处理的变量可以被gProfiler映射到Ensembl基因id上。 默认值是智人(hsapiens)。在

gProfiler接受的物种代码列表如下:https://biit.cs.ut.ee/gprofiler/page/organism-list

许可证### 对于非商业用途,PyMINEr可以通过AGPLv3许可证获得。商业实体应询问scottyler89@gmail.com

我该和谁说话?###在

欢迎加入QQ群-->: 979659372 Python中文网_新手群

推荐PyPI第三方库


热门话题
java为什么会出现这些错误?表达式的非法开始   使用HttpUrlConnection的java测试URL仅适用于前面的www   在大数据集上使用kmeans的java堆外内存   查找Java RandomAccessFile如何以字符形式读取第n个字节   java Android从BroadcastReceiver获取标题和描述   java使用构造函数参数模拟嵌套类并测试方法   正在将Azure Blob项强制转换为Java文件对象   java并行运行testNG套件   java程序在运行时似乎没有进入   贬低Java规则引擎的优点和缺点   文本区域中的java中心文本   java JPA从多个表中选择错误   类Java问题使用类加载器重新加载代码   java如何在Spring非管理类上使用@Value   java(关闭)Gradle导入VS代码失败   java arraylist拆分(“空白”)并计算字数   Android/Java如何在单独的*中调用函数。java文件?   具有基本身份验证的java Apache Camel RSS模块   java为什么程序在出现溢出或下溢时不抛出异常