加入ADASYN平衡功能和目标实验室

2024-09-28 22:50:44 发布

您现在位置:Python中文网/ 问答频道 /正文

我试图平衡我的高度不平衡的数据使用ADASYN库。 在平衡数据之后,我必须将特性和目标标签numpy数组连接到一个数据帧中

下面是我平衡数据的Python代码:

from imblearn.over_sampling import ADASYN
ada = ADASYN()
# X is feature set and y is the label
X_resampled, y_resampled = ada.fit_sample(X, y)
# Add X_resampled, y_resampled into one dataframe

我该怎么做


Tags: 数据代码fromnumpy目标高度is标签
1条回答
网友
1楼 · 发布于 2024-09-28 22:50:44

X_resampledy_resampled是numpy数组,因此我们需要在解决方案中np.hstack(水平堆叠)它们

X_resampled是2D,但是y_resampled是1D。在np.hstack之前,我们需要将y_resampled重塑为一个具有一列的二维数组

总之:

df = pd.DataFrame(np.hstack((X_resampled, y_resampled.reshape(-1, 1))))

相关问题 更多 >