如何对两个混合特征进行二进制编码？

from sklearn.base import BaseEstimator, TransformerMixin class ABTransformer(BaseEstimator, TransformerMixin): def fit(self, x, y=None): return self def transform(self, x): A = x.A B = x.B A0_B0 = np.logical_and((A==0), (B == 0)) A1_B0 = np.logical_and((A==1), (B == 0)) ... data = pd.DataFrame(np.stack((A0_B0, A1_B0,.... ), axis=1), columns=["A0_B0", "A1_B0", ...] ) return data mapper = DataFrameMapper([ (["A", "B"], [ABTransformer()] , {'input_df':True, "alias": None}), ], df_out=True, sparse=False)

1条回答

网友

1楼 · 发布于 2024-10-02 18:17:08

假设列A和B的不同值的数目分别为n_A和n_B，并且所有值都表示为基于零的整数，那么可以使用以下转换函数

def transform(self, x):
    indices = x.B * n_A + x.A
    columns = ["A%d_B%d" % (j, i) for i in range(n_B) for j in range(n_A)]
    onehot = np.eye(n_A * n_B)[indices]
    data = pd.DataFrame(data=onehot, columns=columns)
    return data

编程相关推荐

插入表达式以完成JAVA语句块时出现语法错误
在linkedlist中的特定节点后插入java
java如何将参数传递给安卓 junit测试（参数化测试）
java在运行时将数据添加到片段中的RecyclerView，在该片段中，数据是在单独的片段中创建的
java apache CsrfPreventionFilter和404错误
java Ask是安卓 6.0的多重权限
java将字符串解析为Time并插入mysqldatabase
java扩展MyBatis映射器接口可能导致异常
java SparkSql不支持日期格式
在java中剪切字符串的一部分

相关问题更多 >

编程相关推荐

热门问题

热门文章