如何根据是否存在另一组列来创建新列

df_in A B C D E 1 2 3 4 5 2 4 6 2 3 1 0 2 4 2 df_out A B C D E Group1 Group2 1 2 3 4 5 1 5 2 4 6 2 3 2 6 1 0 2 4 2 0 2

df_in A B C D 1 2 3 4 2 4 6 2 1 0 2 4 df_out A B C D Group1 1 2 3 4 1 2 4 6 2 2 1 0 2 4 0

df_in B C E 2 3 5 4 6 3 0 2 2 df_out B C E Group2 2 3 5 5 4 6 3 6 0 2 2 2

df_in B D E 2 4 5 4 2 3 0 4 2 df_out B D E 2 4 5 4 2 3 0 4 2

1条回答

网友

1楼 · 发布于 2024-10-03 11:21:16

给你，我想你可以用这个：

df_out = (df_in.assign(Group1=df_in.reindex(gp1, axis=1).dropna().min(axis=1), 
                      Group2=df_in.reindex(gp2, axis=1).dropna().max(axis=1))
               .dropna(axis=1, how='all'))

MCVE:

df_in  = pd.read_clipboard() #Read from copy of df_in in the question above
print(df_in)

#   A  B  C  D  E
# 0  1  2  3  4  5
# 1  2  4  6  2  3
# 2  1  0  2  4  2

gp1 = ['A','B','D']
gp2 = ['C','E']

df_out = (df_in.assign(Group1=df_in.reindex(gp1, axis=1).dropna().min(axis=1), 
                      Group2=df_in.reindex(gp2, axis=1).dropna().max(axis=1))
               .dropna(axis=1, how='all'))

print(df_out)

#   A  B  C  D  E  Group1  Group2
# 0  1  2  3  4  5       1       5
# 1  2  4  6  2  3       2       6
# 2  1  0  2  4  2       0       2

df_in_copy=df_in.copy() #make a copy to reuse later
df_in = df_in.drop('E', axis=1) #Drop Col E
print(df_in)

#    A  B  C  D
# 0  1  2  3  4
# 1  2  4  6  2
# 2  1  0  2  4

df_out = (df_in.assign(Group1=df_in.reindex(gp1, axis=1).dropna().min(axis=1), 
                      Group2=df_in.reindex(gp2, axis=1).dropna().max(axis=1))
               .dropna(axis=1, how='all'))
print(df_out)

#    A  B  C  D  Group1
# 0  1  2  3  4       1
# 1  2  4  6  2       2
# 2  1  0  2  4       0


df_in = df_in_copy.copy() #Copy for copy create
df_in = df_in.drop(['A','D'], axis=1) #Drop Columns A and D
print(df_in)

#    B  C  E
# 0  2  3  5
# 1  4  6  3
# 2  0  2  2

df_out = (df_in.assign(Group1=df_in.reindex(gp1, axis=1).dropna().min(axis=1), 
                      Group2=df_in.reindex(gp2, axis=1).dropna().max(axis=1))
               .dropna(axis=1, how='all'))
print(df_out)

#    B  C  E
# 0  2  3  5
# 1  4  6  3
# 2  0  2  2

MCVE:

相关问题更多 >

编程相关推荐

热门问题

热门文章

如何根据是否存在另一组列来创建新列

MCVE:

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >