Python和pandas：如何使用df.loc根据条件创建新列？

id calv1 calv2 calv3 calv4 1 2006-08-29 2007-08-29 2008-08-29 2009-08-29 2 NaT NaT NaT NaT 3 2006-08-29 NaT NaT NaT 4 2006-08-29 2007-08-29 2010-08-29 NaT 5 2006-08-29 2013-08-29 NaT NaT

id calv1 calv2 calv3 calv4 no_calv 1 2006-08-29 2007-08-29 2008-08-29 2009-08-29 4 2 NaT NaT NaT NaT 0 3 2006-08-29 NaT NaT NaT 1 4 2006-08-29 2007-08-29 2010-08-29 NaT 3 5 2006-08-29 2013-08-29 NaT NaT 2

nat = np.datetime64('NaT') df.loc[ (df["calv1"] == nat) & (df["calv2"] == nat) & (df["calv3"] == nat) & (df["calv4"] == nat), "no_calv"] = 0 #1 calvings df.loc[ (df["calv1"] != nat) & (df["calv2"] == nat) & (df["calv3"] == nat) & (df["calv4"] == nat), "no_calv"] = 1 #2 calvings df.loc[ (df["calv1"] != nat) & (df["calv2"] != nat) & (df["calv3"] == nat) & (df["calv4"] == nat), "no_calv"] = 2 #3 calvings df.loc[ (df["calv1"] != nat) & (df["calv2"] != nat) & (df["calv3"] != nat) & (df["calv4"] == nat), "no_calv"] = 3 #4 or more calvings df.loc[ (df["calv1"] != nat) & (df["calv2"] != nat) & (df["calv3"] != nat) & (df["calv4"] != nat), "no_calv"] = 4

2条回答

网友

1楼 · 编辑于 2024-09-26 22:55:34

只要值是datetime（NaT是缺少的值，而不是字符串），您就可以使用：

df['no_calv'] = df.notna().sum(axis = 1)

要获得：

id      calv1      calv2      calv3      calv4 no_calv
1  2006-08-29 2007-08-29 2008-08-29 2009-08-29       4
2         NaT        NaT        NaT        NaT       0 
3  2006-08-29        NaT        NaT        NaT       1
4  2006-08-29 2007-08-29 2010-08-29        NaT       3
5  2006-08-29 2013-08-29        NaT        NaT       2

它会检查是否存在未丢失的值，并沿行（轴=1）求和

网友

2楼 · 编辑于 2024-09-26 22:55:34

您可以使用apply执行此操作：

 def counting_fun(row):
     return len(row.dropna()) # what is the cnt of not pd.nat columns

 df['no_calv'] = df.apply(counting_fun, axis=1)

相关问题更多 >

编程相关推荐

热门问题

热门文章