按df执行df.loc至groupby df

df = pd.DataFrame({'PersonID':['1','1','2','2','2','3'],'O':['A','B','C','B','A','X'],'D':['B','A','B','A','B','Y']}) taxi = pd.DataFrame({'TaxiID':['T1','T2','T3'],'O':['B','A','C'],'D':['A','B','B']}) df_grouped = df.groupby(['O','D']) taxi_grouped = taxi.groupby(['O','D']) dfm = df_grouped.agg({'PersonID':['count',list]}).reset_index() tgm = taxi_grouped.agg({'TaxiID':['count',list]}).reset_index() merged = pd.merge(dfm, tgm, how='inner') seek = df.loc[df.PersonID.isin(merged['PersonID'])]

1条回答

网友

1楼 · 发布于 2024-09-30 05:25:30

为嵌套列表中的标量选择MultiIndexby tuplewith ^{}：

seek = df.loc[df.PersonID.isin(merged[('PersonID', 'list')].explode().unique())]
print (seek)
  PersonID  O  D
0        1  A  B
1        1  B  A
2        2  C  B
3        2  B  A
4        2  A  B

为了获得更好的性能，可以将set comprehension与扁平化一起使用：

seek = df.loc[df.PersonID.isin(set(z for x in merged[('PersonID', 'list')] for z in x))]
print (seek)
  PersonID  O  D
0        1  A  B
1        1  B  A
2        2  C  B
3        2  B  A
4        2  A  B

相关问题更多 >

编程相关推荐

热门问题

热门文章