无监督人口分类

X = CompactSFR[['lgm_tot_p50','sSFR']] from sklearn.cluster import KMeans kmeans2 = KMeans(n_clusters=2) # Fitting the input data kmeans2 = kmeans2.fit(X) # Getting the cluster labels labels2 = kmeans2.predict(X) # Centroid values centroids = kmeans2.cluster_centers_ f, (ax1,ax2) = plt.subplots(nrows=1, ncols=2, figsize=(10, 5), sharey=True) ax1.scatter(CompactSFR['lgm_tot_p50'],CompactSFR['sSFR'],c=labels2); X2 = kmeans2.transform(X) ax1.set_title("Kmeans 2 clusters", fontsize=15) ax1.set_xlabel('$\log_{10}(M)$',fontsize=10) ; ax1.set_ylabel('sSFR',fontsize=10) ; f.subplots_adjust(hspace=0)

1条回答

网友

1楼 · 发布于 2024-10-03 09:08:56

下面的代码将使用由两个分量组成的高斯混合模型来实现这一点，并生成这个结果。

首先，从文件中读取数据并删除异常值：

import pandas as pd
import numpy as np
from sklearn.neighbors import KernelDensity

frm = pd.read_csv(FILE, index_col=0)
kd = KernelDensity(kernel='gaussian')
kd.fit(frm.values)
density = np.exp(kd.score_samples(frm.values))
filtered = frm.values[density>0.05,:]

然后拟合高斯混合模型：

from sklearn.mixture import GaussianMixture
model = GaussianMixture(n_components=2, covariance_type='full')
model.fit(filtered)
cl = model.predict(filtered)

要获得绘图：

import matplotlib.pyplot as plt
plt.scatter(filtered[cl==0,0], filtered[cl==0,1], color='Blue')
plt.scatter(filtered[cl==1,0], filtered[cl==1,1], color='Red')

相关问题更多 >

编程相关推荐

热门问题

热门文章