选择Dataframe groupby，然后根据菜单或文本选项进行筛选

data ={'StudentId':['AAdams','AAdams','AAdams','AAdams','AAdams','AAdams', 'BBrooks','BBrooks','BBrooks','BBrooks','BBrooks',], 'activity':['came school','english','lunch','hindi','sports','left school','came school','english','read','hindi','left school'], 'month':[11,11,11,11,12,12,12,12,12,1,1]} pd.DataFrame(data) StudentId activity month 0 AAdams came school 11 1 AAdams english 11 2 AAdams lunch 11 3 AAdams hindi 11 4 AAdams sports 12 5 AAdams left school 12 6 BBrooks came school 12 7 BBrooks english 12 8 BBrooks read 12 9 BBrooks hindi 1 10 BBrooks left school 1

df[df.b.eq('english').groupby(df.StudentId).cumsum()].reset_index(drop=True) or df.groupby('StudentId').apply(lambda x: x.loc[(x.b == 'english').idxmax():,:]) .reset_index(drop=True)

1条回答

网友

1楼 · 发布于 2024-09-28 03:22:25

如果每个组的第一个值是english，第二个值是hindi，则为解决方案。你知道吗

通过^{}为第一个和第二个需要创建布尔掩码，通过[::-1]索引从后面排序，通过&创建最后一个链掩码，并通过^{}过滤：

m1 = df['activity'].eq('english').astype(int).groupby(df['StudentId']).cumsum().gt(0)
m2 = df['activity'].eq('hindi').astype(int).iloc[::-1].groupby(df['StudentId']).cumsum().gt(0)

df = df[m1 & m2]
print (df)
  StudentId activity  month
1    AAdams  english     11
2    AAdams    lunch     11
3    AAdams    hindi     11
7   BBrooks  english     12
8   BBrooks     read     12
9   BBrooks    hindi      1

相关问题更多 >

编程相关推荐

热门问题

热门文章