在python中将列值分组到稀疏矩阵

G1 G2 G3 G4 G5 G6 G7 G10 G13 G15 G16 user1 1 1 1 0 0 0 1 0 0 0 0 user2 1 0 0 1 0 0 1 1 1 0 0 user3 0 0 0 0 1 1 0 0 1 0 1 user4 0 1 0 0 0 0 0 1 1 1 0

2条回答

网友

1楼 · 编辑于 2024-06-01 09:29:16

您可以使用pandas.crosstab并传递索引和列参数

>>> pd.crosstab(df['User'], df['Group'])

Group  G1  G10  G13  G15  G16  G2  G3  G4  G5  G6  G7
User                                                 
user1   1    0    0    0    0   1   1   0   0   0   1
user2   1    1    1    0    0   0   0   1   0   0   1
user3   0    0    0    0    1   0   0   0   1   1   0
user4   0    1    1    1    0   1   0   0   0   0   0

如果希望列以预期输出中的排序方式显示，可以稍后在crosstab之后对列进行排序（对初始数据帧的Group列进行排序也可以，但会影响性能）：

>>> out = pd.crosstab(df['User'], df['Group'])
>>> out[sorted(out.columns, key= lambda x: int(''.join(i for i in x if i.isdigit())))]

Group  G1  G2  G3  G4  G5  G6  G7  G10  G13  G15  G16
User                                                 
user1   1   1   1   0   0   0   1    0    0    0    0
user2   1   0   0   1   0   0   1    1    1    0    0
user3   0   0   0   0   1   1   0    0    0    0    1
user4   0   1   0   0   0   0   0    1    1    1    0

网友

2楼 · 编辑于 2024-06-01 09:29:16

作为对另一个答案的补充，您可以使用自然排序与natsort：

from natsort import natsorted
df2 = pd.crosstab(df['User'], df['Group'])
df2[natsorted(df2.columns)]

输出：

Group  G1  G2  G3  G4  G5  G6  G7  G10  G13  G15  G16
User                                                 
user1   1   1   1   0   0   0   1    0    0    0    0
user2   1   0   0   1   0   0   1    1    1    0    0
user3   0   0   0   0   1   1   0    0    0    0    1
user4   0   1   0   0   0   0   0    1    1    1    0

相关问题更多 >

编程相关推荐

热门问题

热门文章

在python中将列值分组到稀疏矩阵

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >