擅长:python、mysql、java
<p>如果存在类别的逻辑顺序(即颜色<code>Red</code>与类别<code>Yellow</code>比与类别<code>Green</code>更相似),则可以对类别应用加权值。但这是一个典型的“假”类别特征(因为它可以分解为数字特征向量,如您所示)</p>
<p>如果问题与真实的分类特征有关,则每个类别之间的距离都相同。您可以根据该类别的逻辑重要性(权重)为任何类别特征设置固定距离以进行聚类</p>
<p>如果您的所有功能都是分类的或混合的,请查看<a href="https://github.com/nicodv/kmodes" rel="nofollow noreferrer">k-mode or k-prototype</a>算法</p>