pandas在选定列上更新并跟踪更改d

2024-09-22 16:37:07 发布

您现在位置:Python中文网/ 问答频道 /正文

我有两个数据帧,需要用第二个数据帧中的相应值更新第一个中的某些列,然后更改日期列以反映发生了更改。在

today = datetime.datetime.today().date()

df1 = pd.DataFrame([['alpha','foo','buzz','fox',datetime.date(2017,5,31),np.nan],['Beta','foo','flop','cat',datetime.date(2017,8,11),datetime.date(2017,9,19)],
                   ['Gamma','bar','honk','sheep',datetime.date(2017,8,12),np.nan],['omega','bar','growl','dog',datetime.date(2017,2,23),datetime.date(2017,3,2)]], 
                   columns = ['type','col1','col2','enteredCol','CreationDate','lastUpdateDate']).set_index(['type'])

print df1

      col1   col2 enteredCol CreationDate lastUpdateDate
type                                                    
alpha  foo   buzz        fox   2017-05-31            NaN
Beta   foo   flop        cat   2017-08-11     2017-09-19
Gamma  bar   honk      sheep   2017-08-12            NaN
omega  bar  growl        dog   2017-02-23     2017-03-02


df2 = pd.DataFrame([['alpha','bar','buzz'],['Beta','foo','twist'],['Gamma','bar','honk']], columns = ['type','col1','col2']).set_index(['type'])

print df2
      col1   col2
type             
alpha  bar   buzz
Beta   foo  twist
Gamma  bar   honk

如果df2中的col1或col2不同,我需要更新df1中的相应值。如果进行了更改,则需要将lastUpdateDate设置为今天的日期

^{pr2}$

想我怎么做?我可以手动合并每个已更改的列并进行比较,但有许多列需要检查。数据框更新()没有提供一种方法来说明值已更改,或者我也可以使用它。在


Tags: 数据alphadatetimedatefootypebarbeta
2条回答

我在努力分析你的问题。 但如果我没看错的话,就戴上面具。在

for col in ['col1','col2']:
    to_update = df1[col] != df2[col]
    df1.loc[to_update,col] = df2.loc[to_update,col]
    df1.loc[to_update,'lastUpdateDate'] = todays_date

其中todays_date是字符串格式的日期

使用combine_first然后使用布尔索引:

df_out = df2.combine_first(df1)

df_out.loc[~df1[['col1','col2']].eq(df_out[['col1','col2']]).all(1),'lastUpdateDate'] = today

print(df_out)

输出:

^{pr2}$

相关问题 更多 >