应用Pandas数据帧引用前一行以计算差异

player date A 2010-01-01 A 2010-01-09 A 2010-01-11 A 2010-01-15 B 2010-02-01 B 2010-02-10 B 2010-02-21 B 2010-02-23

player date diff A 2010-01-01 0 A 2010-01-09 8 A 2010-01-11 2 A 2010-01-15 4 B 2010-02-01 0 B 2010-02-10 9 B 2010-02-21 11 B 2010-02-23 2

3条回答

网友
1楼 · 编辑于 2024-06-25 23:12:14

你可以简单地写下：
df['difference'] = df.groupby('player')['date'].diff().fillna(0)
这将为新的timedelta列提供正确的值：
player date difference 0 A 2010-01-01 0 days 1 A 2010-01-09 8 days 2 A 2010-01-11 2 days 3 A 2010-01-15 4 days 4 B 2010-02-01 0 days 5 B 2010-02-10 9 days 6 B 2010-02-21 11 days 7 B 2010-02-23 2 days
（我使用了名称“difference”而不是“diff”来区分名称和方法diff）

网友
2楼 · 编辑于 2024-06-25 23:12:14

shift()是一个很好的函数，但是，如果需要避免数据重复，我建议使用以下方法。
def date_diff(row): index = df.index.get_loc(row.name) if index == 0: return np.nan prev_row = df.iloc[index - 1] return row['date'] - prev_row['date'] df['difference'] = df.apply(date_diff, axis=1)

网友
3楼 · 编辑于 2024-06-25 23:12:14

如果要手动实现它，另一种方法是执行以下操作

def date_diff(df):
    df['difference'] = df['date'] - df['date'].shift()
    df['difference'].fillna(0 ,inplace = True)
    return df

In [30]:
df_final = df.groupby(df['player']).apply(date_diff)
df_final
Out[30]:
player  date    difference
A   2010-01-01  0 days
A   2010-01-09  8 days
A   2010-01-11  2 days
A   2010-01-15  4 days
B   2010-02-01  0 days
B   2010-02-10  9 days
B   2010-02-21  11 days
B   2010-02-23  2 days

相关问题更多 >

编程相关推荐

热门问题

热门文章