如何用make\ u blobs创建imbalace样本数据?

2024-09-28 19:32:41 发布

您现在位置:Python中文网/ 问答频道 /正文

我正在使用sklearn包中的make\u blobs。你知道吗

from sklearn.datasets.samples_generator import make_blobs

我想创建具有不平衡特征的示例数据。例如,我想要400个featureurea和50个FeatureB。你知道吗

默认情况下,下面的代码以相等的速度生成这两个特性编号:-你知道吗

X, y = make_blobs(n_samples=450, centers=2, cluster_std=[10.0, 2],random_state=22,n_features=2)

下面是为上面生成的数据创建的计数图代码:- enter image description here

请建议我怎样才能达到我的要求?你知道吗


Tags: 数据代码fromimport示例make情况特征
1条回答
网友
1楼 · 发布于 2024-09-28 19:32:41

我想你应该创建两类数据,一类是400,另一类是50。我设置了“中心=无”。对吗?我用这个代码,它给你想要的。请参考此链接: sklearn.datasets.make_blobs

import numpy as np
import matplotlib.pyplot as plt

X, y = make_blobs(n_samples=[400,50], centers=None, cluster_std=[10.0, 2],random_state=22,n_features=2)
print(y)
Zero0=np.where(y == 0)[0]
One1=np.where(y == 1)[0]
print(Zero0)
print(One1)
plt.scatter(X[Zero0,0],X[Zero0,1],color=['red'])
plt.scatter(X[One1,0],X[One1,1],color=['green'])
plt.show()
plt.scatter(X[:,0],X[:,1])
plt.show()

enter image description here

相关问题 更多 >