Pandas透视多个分类列

name = ['fred','fred','fred','james','james','rick','rick','jeff'] actionfigures = ['superman','batman','flash','greenlantern','flash','batman','joker','superman'] cars = ['lamborghini', 'ferrari','bugatti','ferrari','corvette','bugatti','bmw','bmw'] pets = ['cat','dog','bird','cat','dog','dog','fish','marmet'] test = pd.DataFrame({'name':name,'actfig':actionfigures,'car':cars,'pet':pets}) actfig car name pet 0 superman lamborghini fred cat 1 batman ferrari fred dog 2 flash bugatti fred bird 3 greenlantern ferrari james cat 4 flash corvette james dog 5 batman bugatti rick dog 6 joker bmw rick fish 7 superman bmw jeff marmet

2条回答

网友

1楼 · 编辑于 2024-10-01 02:34:48

melt和{}

test.melt('name').assign(new=1).pivot('name','value','new').fillna(0)
Out[239]: 
value  batman  bird  bmw  bugatti  cat  corvette  dog  ferrari  fish  flash  \
name                                                                          
fred      1.0   1.0  0.0      1.0  1.0       0.0  1.0      1.0   0.0    1.0   
james     0.0   0.0  0.0      0.0  1.0       1.0  1.0      1.0   0.0    1.0   
jeff      0.0   0.0  1.0      0.0  0.0       0.0  0.0      0.0   0.0    0.0   
rick      1.0   0.0  1.0      1.0  0.0       0.0  1.0      0.0   1.0    0.0   
value  greenlantern  joker  lamborghini  marmet  superman  
name                                                       
fred            0.0    0.0          1.0     0.0       1.0  
james           1.0    0.0          0.0     0.0       0.0  
jeff            0.0    0.0          0.0     1.0       1.0  
rick            0.0    1.0          0.0     0.0       0.0

或get_dummies

^{pr2}$

编辑：根据PiR

pd.get_dummies(test.set_index('name'), prefix_sep='|').sum(level=0).rename(columns=lambda c: c.rsplit('|', 1)[1])

网友

2楼 · 编辑于 2024-10-01 02:34:48

选项1
pd.get_dummies按部件

a = pd.get_dummies(test.actfig)
c = pd.get_dummies(test.car)
p = pd.get_dummies(test.pet)
n = pd.get_dummies(test.name).T

pd.concat([n.dot(d) for d in [a, c, p]], axis=1)

       batman  flash  greenlantern  joker  superman  bmw  bugatti  corvette  ferrari  lamborghini  bird  cat  dog  fish  marmet
fred        1      1             0      0         1    0        1         0        1            1     1    1    1     0       0
james       0      1             1      0         0    0        0         1        1            0     0    1    1     0       0
jeff        0      0             0      0         1    1        0         0        0            0     0    0    0     0       1
rick        1      0             0      1         0    1        1         0        0            0     0    0    1     1       0

选项2
stack+pd.crosstab

^{pr2}$

相关问题更多 >

编程相关推荐

热门问题

热门文章