如何将大小不等的字典和元素列表转换为具有1和0值的数据帧

{'GP': ['col_1', 'col_2', 'col_3', 'col_4'], 'MIN': ['col_1', 'col_2', 'col_3', 'col_4'], 'PTS': ['col_1', 'col_2', 'col_3', 'col_4'], 'FGM': ['col_1', 'col_2', 'col_4'], 'FGA': ['col_2'], 'FG%': ['col_2', 'col_3', 'col_4'], '3P Made': ['col_2', 'col_3'], 'AST': ['col_2', 'col_3'], 'STL': ['col_2'], 'BLK': ['col_2', 'col_3'], 'TOV': ['col_3']}

col_1 col_2 col_3 col_4 GP 1 1 1 1 MIN 1 1 1 1 PTS 1 1 1 1 FGM 1 1 0 1 FGA 0 1 0 0 FG% 0 1 1 1 3P Made 0 1 1 0 AST 0 1 1 0 STL 0 1 0 0 BLK 0 1 1 0 TOV 0 0 1 0

2条回答

网友

1楼 · 编辑于 2024-09-21 03:18:10

将^{}与词典的d.keys()和d.values()一起使用：

from sklearn.preprocessing import MultiLabelBinarizer

mlb = MultiLabelBinarizer()
df = pd.DataFrame(mlb.fit_transform(d.values()), index=d.keys(),columns=mlb.classes_)
print (df)
         col_1  col_2  col_3  col_4
GP           1      1      1      1
MIN          1      1      1      1
PTS          1      1      1      1
FGM          1      1      0      1
FGA          0      1      0      0
FG%          0      1      1      1
3P Made      0      1      1      0
AST          0      1      1      0
STL          0      1      0      0
BLK          0      1      1      0
TOV          0      0      1      0

Pandas是唯一的解决方案，但是Series、^{}和^{}的速度较慢：

df = pd.Series(d).str.join('|').str.get_dummies()

网友

2楼 · 编辑于 2024-09-21 03:18:10

您可以创建一个系列explode它，然后将get_dummies与sum一起使用：

pd.get_dummies(pd.Series(d).explode()).sum(level=0)

或者您可以玩分解的系列和unstack：

(pd.Series(d).explode()
   .to_frame(name='cols')
   .assign(values=1)
   .set_index('cols', append=True)['values']
   .unstack('cols', fill_value=0)
)

输出：

         col_1  col_2  col_3  col_4
GP           1      1      1      1
MIN          1      1      1      1
PTS          1      1      1      1
FGM          1      1      0      1
FGA          0      1      0      0
FG%          0      1      1      1
3P Made      0      1      1      0
AST          0      1      1      0
STL          0      1      0      0
BLK          0      1      1      0
TOV          0      0      1      0

相关问题更多 >

编程相关推荐

热门问题

热门文章