同时利用稀疏矩阵和其他特征学习决策树

import numpy as np import pandas as pd from scipy.sparse import csr_matrix a = np.random.randn(10,3) b = np.random.random((10,1)) df = pd.DataFrame(a, columns = "A B C".split()) df['temp'] = b df['dum1'] = np.where(df.temp < 0.5, 1, 0) df['dum2'] = np.where(df.temp >= 0.5, 1, 0) del df['temp'] df_with_dummies = df.copy() a = df[['dum1', 'dum2']] dums = csr_matrix(a) df['dums'] = dums df_with_sparse = df.copy()

1条回答

网友

1楼 · 发布于 2024-09-30 08:21:03

当您这样做时：

df['dums'] = dums

dums作为稀疏矩阵，pandas数据帧没有正确处理，它将被广播到每一行。pandas并不抱怨它，因为它认为稀疏矩阵是一个非数组对象。在

这意味着df['dums']列中的每个元素都将指向整个稀疏矩阵dums。因此，本质上，每个数组元素都是用数组设置的，因此在scikit学习估计器中处理它时会出现错误setting an array element with a sequence。在

为此，您可以：

^{pr2}$

现在你可以把这个再过一遍。在

相关问题更多 >

编程相关推荐

热门问题

热门文章