按函数聚合

网友

1楼 · 编辑于 2024-10-01 22:30:20

可能有多种方法可以做到这一点。一种方法是先按电影名称的开头进行过滤，然后进行聚合和合并。你知道吗

cane = movie_df[movie_df['movie'].str.startswith('cane1')]
wind = movie_df[movie_df['movie'].str.startswith('wind')]

cane_sum = cane.groupby(['id']).agg({'movie':'first', 'value':'sum'}).reset_index()
wind_count = wind.groupby(['id']).agg({'movie':'first', 'value':'count'}).reset_index()

pd.concat([cane_sum, wind_count])

网友

2楼 · 编辑于 2024-10-01 22:30:20

在可能的情况下，您应该瞄准矢量化操作。你知道吗

您可以计算两个结果，然后将它们串联起来。你知道吗

mask = df['movie'].str.startswith('cane')

df1 = df[mask].groupby('movie')['value'].sum()
df2 = df[~mask].groupby('movie').size()

res = pd.concat([df1, df2], ignore_index=0)\
        .rename('value').reset_index()

print(res)

    movie  value
0   cane1    8.0
1  cane22    4.0
2  cane34    7.0
3   wind1    1.0
4   wind2    2.0

网友

3楼 · 编辑于 2024-10-01 22:30:20

首先，您需要执行字符串操作。我猜在你的情况下，你不想在电影名字里加数字。使用pandas applying regex to replace values中讨论的解决方案。然后对新序列调用groupby（）。你知道吗

仅供参考：有些电影名称只有数字，在这种情况下，您需要使用更新功能。https://pandas.pydata.org/pandas-docs/stable/generated/pandas.DataFrame.update.html

相关问题更多 >

编程相关推荐

热门问题

热门文章

按函数聚合

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >