创建数据帧，并根据新列是否存在将其设置为True/False

df = pd.DataFrame({'ID' : [0, 0, 1, 1, 1], 'REV' : [0, 0, 1, 1, 1], 'GROUP' : [1, 2, 1, 2, 3]}) +----+-----+-------+ | ID | REV | GROUP | +----+-----+-------+ | 0 | 0 | 1 | | 0 | 0 | 2 | | 1 | 1 | 1 | | 1 | 1 | 2 | | 1 | 1 | 3 | +----+-----+-------+

+----+-----+------+------+-------+ | ID | REV | 1 | 2 | 3 | +----+-----+------+------+-------+ | 0 | 0 | True | True | False | | 1 | 1 | True | True | True | +----+-----+------+------+-------+

3条回答

网友

1楼 · 编辑于 2024-09-29 02:28:07

您可以创建一个与GROUP相同的伪列，然后将该伪列用作pivot_table()中的值

df['GROUP_'] = df['GROUP']

df_ = ~ pd.pivot_table(df, index=['ID', 'REV'], columns='GROUP', values='GROUP_').isna()

print(df_)

GROUP      1     2      3
ID REV                   
0  0    True  True  False
1  1    True  True   True

print(df_.reset_index().rename_axis(None,axis=1))

   ID  REV     1     2      3
0   0    0  True  True  False
1   1    1  True  True   True

网友

2楼 · 编辑于 2024-09-29 02:28:07

尝试使用crosstab

out = pd.crosstab([df.ID,df.REV],df.GROUP).ne(0).reset_index().rename_axis(None,axis=1)
out
   ID  REV     1     2      3
0   0    0  True  True  False
1   1    1  True  True   True

网友

3楼 · 编辑于 2024-09-29 02:28:07

我会使用get_dummies，然后使用groupby和any：

pd.get_dummies(df.set_index(["ID", "REV"]).GROUP).groupby(level=[0,1]).any()


           1     2      3
ID REV                   
0  0    True  True  False
1  1    True  True   True

如果希望ID和REV列作为列而不是索引，可以添加reset_index：

pd.get_dummies(df.set_index(["ID", "REV"]).GROUP).groupby(level=[0,1]).any().reset_index()

   ID  REV     1     2      3
0   0    0  True  True  False
1   1    1  True  True   True

相关问题更多 >

编程相关推荐

热门问题

热门文章