通过get\u dummies和pivot\u tab在融化后加入一个热编码

import pandas as pd import numpy as np df = pd.DataFrame({'id' : [1, 2], 'C1' : ['X1', 'X2'], 'C2' : ['X2', np.NaN], 'C3' : ['X3', np.NaN], 'C4' : ['X4', 'X4']})

1条回答

网友

1楼 · 发布于 2024-10-03 19:32:12

你不需要做一个热编码。如果你把“label”和“strval”放在同一列中，然后分组，你应该得到你需要的。你知道吗

df_concat = pd.concat(
    (dflab.drop(columns=['label']).rename({'strval': 'val'}, axis=1), 
     dflab.drop(columns=['strval']).rename({'label': 'val'}, axis=1)), 
    axis=0)

# use .any() or .count() as you would set aggfunc='any' or 'count'
dfg = df_concat.groupby(['id', 'val']).count()

# pivot to go from long to wide dataframe
dfg.reset_index().pivot('id', 'val').fillna(0).astype(int)

编程相关推荐

java从Dropwizard中的Minio检索文件时，GET请求中的超时是如何处理的？
带Hibernate的java Jackson用于序列化以避免枚举
Raspberry Pi上的java Jave分段错误
java在屏幕旋转时不保存当前片段和数据
java War文件未在Heroku上正确部署
如何使用Java处理Selenium webdriver中的促销广告或cookie
java处理“用法：PApplet[options]<classname>[sketch args]”
java文本文件错误扫描程序
运行第一个JavaFX模块化程序时出现java异常
java将fileoutputstream转换为字符串

相关问题更多 >

编程相关推荐

热门问题

热门文章

通过get\u dummies和pivot\u tab在融化后加入一个热编码

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >