PyMINEr:从大型数据集中自动获取生物学见解。
bio-pyminer的Python项目详细描述
自述文件
教程
我制作了一些视频,引导您了解输出以及如何在此处安装和使用PyMINEr: www.ScienceScott.com/pyminer在
这个存储库是用来做什么的?###在
- 细胞类型识别使用新的聚类算法,当应用于真实世界和合成数据集时,其性能优于一些竞争对手
- 基本统计和浓缩分析
- 通路分析
- 支持图论分析的基于Spearman相关的表达式图
- 在细胞类型内和跨细胞类型中建立硅预测的自分泌/旁分泌信号网络
- 基于这些分析创建可发布的视觉效果
- 生成解释运行结果的网页
- 未来的版本将包含更新的聚类方法,用于重建单细胞谱系,以及其他一些很酷的功能
如何设置?###在
PyMINEr现在可以安装pip了: python3-m pip安装bio pyminer 请注意,还有另一个名为pyminer的软件包,用于挖掘比特币-这绝对不是这样的,所以一定要安装bio pyminer!在
也可以使用设置.py在发行版中编写如下脚本: Python3设置.py安装
如何运行PyMINEr?### PyMINEr将一个经过清理和规范化(通常是日志转换的)制表符分隔的2D矩阵文本文件作为输入。 例如:
genes cell_1 cell_2 … ACTB 5.3012 6.3102 … … … … …
您可以在命令行中将此文本文件输入PyMINEr:
<引用>pyminer.py-我表达式.txt
如果有一个非常大的文件,可以将其转换为hdf5,以便在内存之外运行管道:
tab_到\u h5.py表达式.txt
这将生成3个文件: *表达式.hdf5 *ID_列表.txt基因列表(无标题行) *列_IDs.txt文件列的示例名称。在
就这样。不过,还有一些有趣的事情你可以做,比如如果你在研究一种非人类的东西,你应该能够忽略这个论点——物种, 后面是gProfiler获取的物种代码。这将自动进行大量的路径分析,只要你正在处理的变量可以被gProfiler映射到Ensembl基因id上。 默认值是智人(hsapiens)。在
gProfiler接受的物种代码列表如下:https://biit.cs.ut.ee/gprofiler/page/organism-list
许可证### 对于非商业用途,PyMINEr可以通过AGPLv3许可证获得。商业实体应询问scottyler89@gmail.com
我该和谁说话?###在
- 回购所有者/管理员:scottyler89+bitbucket@gmail.com
- 项目
标签: