比较groupby中不同行的值

def check_consistency(df): grouped_df = df.groupby('id') for key, group in grouped_df: df = pd.DataFrame() df['start'] = group['start'].iloc[1:] df['end'] = group['end'].shift().iloc[1:] consistent = df['start'] == df['end'] if not all(consistent): print(key) print(df[consistent == False])

1条回答

网友

1楼 · 发布于 2024-06-14 17:32:48

首先，我们按id排序。然后制作一个掩码，将每个start与前一行end进行比较，并按id分组

对于每个组，mask的第一个条目默认为True，因为它没有前一行，并且不用于我们的提取

最后，我们通过使用带布尔掩码求反的.loc来选择掩码为False（start不等于前一行end）的行

df1 = df.sort_values('id', kind='mergesort')    # Merge Sort for stable sort to maintain sequence other than sort key
mask = (df1['start']
           .eq(df1['end'].shift())
           .groupby(df1['id']).transform(lambda x: [True] + x.iloc[1:].tolist())
       )
df1.loc[~mask]

输出：

   start     end  id
5     11      13   1

相关问题更多 >

编程相关推荐

热门问题

热门文章

比较groupby中不同行的值

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >