有条件地用不同datafram中的值替换pandas中的列值

df: TargetIndex Current1 Current2 Current3 0 0 'D' 'D' 'G' 1 2 0 'E' 'F' 2 0 'A' 'E' 'F' 3 1 0 0 0 4 0 'A' 0 'A' 5 3 'G' 0 0 6 2 'F' 'E' 0 7 4 0 0 0 df2: TargetIndex Target1 Target2 Target3 0 1 'A' 'A' 'A' 1 2 'B' 'B' 'B' 2 3 'C' 'C' 'C' 3 4 'A' 'B' 'C'

df['Target1'] = df['TargetIndex'].map(df2.set_index('TargetIndex')['Target1']) df['Target2'] = df['TargetIndex'].map(df2.set_index('TargetIndex')['Target2']) df['Target3'] = df['TargetIndex'].map(df2.set_index('TargetIndex')['Target3']) S1 = df.Current1 == 0 S2 = df.Current2 == 0 S3 = df.Current3 == 0 df.loc[S1, 'Current1'] = df['TargetIndex'] df.loc[S2, 'Current2'] = df['TargetIndex'] df.loc[S3, 'Current3'] = df['TargetIndex'] df.replace({'Current1': { 1 : 'A', 2 : 'B', 3 : 'C', 4 : 'A'}}, inplace=True) df.replace({'Current2': { 1 : 'A', 2 : 'B', 3 : 'C', 4 : 'B'}}, inplace=True) df.replace({'Current3': { 1 : 'A', 2 : 'B', 3 : 'C', 4 : 'C'}}, inplace=True) df.drop(df.columns[[4, 5, 6]], axis=1, inplace=True)

df: TargetIndex Current1 Current2 Current3 0 0 'D' 'D' 'G' 1 2 'B' 'E' 'F' 2 0 'A' 'E' 'F' 3 1 'A' 'A' 'A' 4 0 'A' 0 'A' 5 3 'G' 'C' 'C' 6 2 'F' 'E' 'B' 7 4 'A' 'B' 'C'

1条回答

网友

1楼 · 发布于 2024-10-06 07:59:58

如果列数相同，则可以使用：

#create index with 
df1 = df1.set_index('TargetIndex')
df2 = df2.set_index('TargetIndex')
#set same columns names for align data
df2.columns = df1.columns

#replace 0 with NaNs and replace NaNs by df2
df = df1.mask(df1 == 0).combine_first(df2)
print (df)
            Current1 Current2 Current3
TargetIndex                           
0                'D'      'D'      'G'
0                'A'      'E'      'F'
0                'A'      NaN      'A'
1                'A'      'A'      'A'
2                'B'      'E'      'F'
2                'F'      'E'      'B'
3                'G'      'C'      'C'
4                'A'      'B'      'C'

如果顺序很重要，添加reset_index进行排序：

df1 = df1.reset_index().set_index('TargetIndex')
df2 = df2.set_index('TargetIndex')
df2.columns = df1.columns[1:]

df = (df1.mask(df1 == 0)
        .combine_first(df2)
        .sort_values('index')
        .drop('index', 1)
        .reset_index()
        .fillna(0))
print (df)
   TargetIndex Current1 Current2 Current3
0            0      'D'      'D'      'G'
1            2      'B'      'E'      'F'
2            0      'A'      'E'      'F'
3            1      'A'      'A'      'A'
4            0      'A'        0      'A'
5            3      'G'      'C'      'C'
6            2      'F'      'E'      'B'
7            4      'A'      'B'      'C'

相关问题更多 >

编程相关推荐

热门问题

热门文章