相对聚类验证以选择最佳聚类数

reval的Python项目详细描述


reval:基于稳定性的相对聚类验证方法确定最佳聚类数

确定对数据集进行最佳分区的集群数量可能是一项具有挑战性的任务,因为1)缺少 无监督学习框架中的先验信息;2)缺乏唯一的聚类验证 评估聚类解决方案的方法。这里我们展示reval:一个Python包,它利用 基于稳定性的相对聚类验证方法,用于确定最佳聚类解决方案,如[1]所述。在

R和Python中的统计软件通常计算可利用的内部验证指标 选择最适合数据和易于实现的开源软件解决方案的集群数量 缺乏相关的聚类技术。相对方法相对于内部验证方法的优势 事实上,内部指标利用数据本身的特性来产生结果, 相对验证将无监督聚类算法转化为有监督的分类问题, 从而使结果具有普遍性和可复制性。在

要求

python>=3.6

安装

来自github:

^{pr2}$

PyPI替代方案:

pip install reval

文件

代码文档可以找到here。文档包括Python代码 说明,reval用法示例, 基准数据集的性能,以及可能遇到的与数据集数量的特性相关的常见问题 还有样品。在

参考文献

[1]Lange,T.,Roth,V.,Braun,M.L.和Buhmann,J.M.(2004年)。基于稳定性的聚类解决方案验证。 神经计算,16(6),1299-1323。在

引用为

Isotta Landi, Veronica Mandelli, & Michael Vincent Lombardo. (2020, June 29). 
reval: stability-based relative clustering validation method to determine the best number of clusters 
(Version v1.0.0). Zenodo. http://doi.org/10.5281/zenodo.3922334

BibTeX替代品

@software{isotta_landi_2020_3922334,
          author       = {Isotta Landi and
                          Veronica Mandelli and
                          Michael Vincent Lombardo},
          title        = {{reval: stability-based relative clustering 
                           validation method to determine the best number of
                           clusters}},
          month        = jun,
          year         = 2020,
          publisher    = {Zenodo},
          version      = {v1.0.0},
          doi          = {10.5281/zenodo.3922334},
          url          = {https://doi.org/10.5281/zenodo.3922334}
        }

欢迎加入QQ群-->: 979659372 Python中文网_新手群

推荐PyPI第三方库


热门话题
javascript节点js require()和Rhino Shell load()之间的区别是什么?   While循环中的java If语句   java GXT如何在XTemplate中显示treeobject?   如何将黑白图像加载到二进制文件中?   java ORMLite不知道如何存储班级航班。扫描仪。modelFX。机场航空公司的AirlineFx。使用另一个类或自定义持久器   java组织。阿帕奇。德比。客户是SqlException JSP和JSTL查询   spring如何将clob数据分配给java变量   java从上的表获取数据(Spring)   javaphp使用Exec执行带有用户定义参数的Jar文件   java jsonschema2pojo:引用相同类型的对象   使用原语从Scala调用Java vararg方法   java ClassNotFoundException:ClientBuilder Jersey 2.25.1 Tomcat 9.0   Android(Java)cr_BindingManager:无法调用determinedVisibility()从未看到pid的连接:   Java使用LocalTime类比较没有日期的时间   Java如何初始化对象的参数?