clusteval是一个python包,它为无监督的集群验证提供了各种方法。
clusteval的Python项目详细描述
俱乐部
- clusteval是用于无监督集群评估的Python包。 实现了五种可用于评估集群的方法:剪影、dbindex、导数、dbscan和hdbscan。在
目录
安装
- 在
从PyPI安装clusteval(推荐)。clusteval与python3.6+兼容,可在Linux、macosx和Windows上运行。在
在 - 在
它是根据麻省理工学院的许可证发行的。在
在 - 在
可以按如下方式创建新环境:
在
condacreate-nenv_clustevalpython=3.6condaactivateenv_clusteval^{pr2}$
- Beta版可以从GitHub源安装:
git clone https://github.com/erdogant/clusteval
cd clusteval
pip install -U .
导入clusteval包
fromclustevalimportclusteval
创建示例数据集
# Generate random datafromsklearn.datasetsimportmake_blobsX,labx_true=make_blobs(n_samples=750,centers=4,n_features=2,cluster_std=0.5)
基于剪影得分的聚类验证
# Determine the optimal number of clustersce=clusteval(method='silhouette')ce.fit(X)ce.plot()ce.dendrogram()ce.scatter(X)
在
基于davies-boulin指数的聚类验证
# Determine the optimal number of clustersce=clusteval(method='dbindex')ce.fit(X)ce.plot()ce.scatter(X)ce.dendrogram()
在
导数法聚类验证
# Determine the optimal number of clustersce=clusteval(method='derivative')ce.fit(X)ce.plot()ce.scatter(X)ce.dendrogram()
在
使用dbscan的集群验证
# Determine the optimal number of clusters using dbscan and silhouttece=clusteval(cluster='dbscan')ce.fit(X)ce.plot()ce.scatter(X)ce.dendrogram()
在
使用hdbscan的集群验证
要运行hdbscan,需要安装它。此库不包含在clusteval
安装文件中,因为它经常会出现安装问题。在
pip install hdbscan
# Determine the optimal number of clustersce=clusteval(cluster='hdbscan')ce.plot()ce.scatter(X)
在
引文
如果这对你的研究有用,请在你的出版物中引用clusteval。以下是BibTeX条目示例:
@misc{erdogant2019clusteval,title={clusteval},author={Erdogan Taskesen},year={2019},howpublished={\url{https://github.com/erdogant/clusteval}},}
托多
- 当基本真实聚类有大的等大小的簇时使用ARI
- 当地面真实聚类不平衡且存在小簇时,美国AMI
- https://scikit-learn.org/stable/modules/generated/sklearn.metrics.adjusted_rand_score.html
- https://scikit-learn.org/stable/auto_examples/cluster/plot_adjusted_for_chance_measures.html#sphx-glr-auto-examples-cluster-plot-adjusted-for-chance-measures-py
维护人员
- 项目
标签: