相对聚类验证以选择最佳聚类数
reval的Python项目详细描述
reval
:基于稳定性的相对聚类验证方法确定最佳聚类数
确定对数据集进行最佳分区的集群数量可能是一项具有挑战性的任务,因为1)缺少
无监督学习框架中的先验信息;2)缺乏唯一的聚类验证
评估聚类解决方案的方法。这里我们展示reval
:一个Python包,它利用
基于稳定性的相对聚类验证方法,用于确定最佳聚类解决方案,如[1]所述。在
R和Python中的统计软件通常计算可利用的内部验证指标 选择最适合数据和易于实现的开源软件解决方案的集群数量 缺乏相关的聚类技术。相对方法相对于内部验证方法的优势 事实上,内部指标利用数据本身的特性来产生结果, 相对验证将无监督聚类算法转化为有监督的分类问题, 从而使结果具有普遍性和可复制性。在
要求
python>=3.6
安装
来自github:
^{pr2}$PyPI替代方案:
pip install reval
文件
代码文档可以找到here。文档包括Python代码
说明,reval
用法示例,
基准数据集的性能,以及可能遇到的与数据集数量的特性相关的常见问题
还有样品。在
参考文献
[1]Lange,T.,Roth,V.,Braun,M.L.和Buhmann,J.M.(2004年)。基于稳定性的聚类解决方案验证。 神经计算,16(6),1299-1323。在
引用为
Isotta Landi, Veronica Mandelli, & Michael Vincent Lombardo. (2020, June 29).
reval: stability-based relative clustering validation method to determine the best number of clusters
(Version v1.0.0). Zenodo. http://doi.org/10.5281/zenodo.3922334
BibTeX替代品
@software{isotta_landi_2020_3922334,
author = {Isotta Landi and
Veronica Mandelli and
Michael Vincent Lombardo},
title = {{reval: stability-based relative clustering
validation method to determine the best number of
clusters}},
month = jun,
year = 2020,
publisher = {Zenodo},
version = {v1.0.0},
doi = {10.5281/zenodo.3922334},
url = {https://doi.org/10.5281/zenodo.3922334}
}
- 项目
标签: