Pandas：在列中计算相同的值，但来自不同的索引

data = {'rating_id': ['1', '2','3','4','5','6','7','8','9'], 'user_id': ['56', '13','56','99','99','13','12','88','45'], 'restaurant_id': ['xxx', 'xxx','yyy','yyy','xxx','zzz','zzz','eee','eee'], 'star_rating': ['2.3', '3.7','1.2','5.0','1.0','3.2','1.0','2.2','0.2'], 'rating_year': ['2012','2012','2020','2001','2020','2015','2000','2003','2004'], 'first_year': ['2012', '2012','2001','2001','2012','2000','2000','2001','2001'], 'last_year': ['2020', '2020','2020','2020','2020','2015','2015','2020','2020'], } df = pd.DataFrame (data, columns = ['rating_id','user_id','restaurant_id','star_rating','rating_year','first_year','last_year']) df['star_rating'] = df['star_rating'].astype(float) df['nb_rating'] = ( df.groupby('restaurant_id')['rating_id'].transform('count') ) #here df['nb_opened_sameYear'] = ( df.groupby('restaurant_id')['first_year'] .transform('count') ) df.head(10)

1条回答

网友
1楼 · 发布于 2024-09-29 23:15:35

IIUC，您希望在第一年groupby和在列restaurant\u id上transform使用^{}。请尝试：
df['nb_opened_sameYear'] = ( df.groupby('first_year')['restaurant_id'] .transform('nunique') )

相关问题更多 >

编程相关推荐

热门问题

热门文章