基于一致聚类和最小生成树集合的基因表达数据的细胞谱系稳健推断。

ECLAIR的Python项目详细描述


如何生成eclair图和树

eclair代表用于血统分析、推断的集成聚类 以及稳健性。它按如下方式进行:

  • 在亲和力传播、分层或k-means聚类中进行选择 和dbscan(cf.我们的 dbscan_multiplex concurrent_ap dbscan和 亲和力传播聚类)用于如何从 数据集的子样本。
  • 通过基于密度的下采样(如 在python上发布的密度采样软件中实现 包索引),或者通过针对数据点的总数 从数据集中提取或通过指定 根据每个数据点周围的本地密度建立的分布。
  • 然后eclair开始进行几轮下采样 在这样的子样本上进行聚类,迭代次数由指定 用户。在每次对给定子样本进行聚类之后, 下采样过程留下的数据点是 通过将它们与 高维特征空间。
  • 对于每次这样的运行,构建一个最小生成树。这个最小值 生成树是由l2对相似矩阵得到的。 在与每个簇相关联的质心之间。
  • 下一步从这个集合中获得一致的聚类 整个数据集的分区。三种启发式方法是 为此考虑:CSPA、HGPA和MCLA,所有这些都基于 关于图或超图划分(参见 集群集成 包以获取更多信息。
  • 一旦达成一致的聚类,我们就从 共识集群和来自与 这些一致性集群所具有的分区的集合 已计算。此图的边权重计算为 以下分布的平均值:对于每个由 来自一致性集群的一个数据点和另一个数据点 从consense cluster b ,扫描分区集合 记录下两个样本之间的距离 组成群集集成的每个分区。
  • 然后我们从这个图中得到一个最小生成树 可视化的便利性以及与 很少有其他方法能提供细胞谱系的估计 (包括流行的黑桃法,其重现性问题刺激了 eclair的发展。本包中的一个模块确实专门用于 说明ECLAir优越的统计性能)。

欢迎加入QQ群-->: 979659372 Python中文网_新手群

推荐PyPI第三方库


热门话题
java这句话的第一个<U>是什么意思?   java在Android中转换为无符号字符和无符号短字符   java数学。显示工作结果的acos   java JDBC Mysqlconnector位于类路径中,但未找到   java hsqldb hibernate persist@Lob   集合对象无法显示在java、Arraylist、Collection中显示某些未定义值的输出   在Java中尝试在二叉搜索树上实现级别顺序遍历   如何在java对象中获取注释   java在会话超时时删除自定义cookie   java JDBC编程   返回语句上未选中强制转换的java警告   初学者二进制搜索中的java错误   java Azure BlockBlobClient下载时响应文件大小问题   JavaSeleniumWebDriver正在寻找Chrome的错误路径。exe   amazon web服务AWS Lambda(Java)调用错误的对象实例   检测到java Eclipse插件,但未加载   Java中类似于PHP的playframework Autoloader   java使用Google应用程序引擎生成实体列表,希望在Android客户端访问它   JavaZK国际化:UNICODE代替重音字符