基于组创建新的数据帧

new_df = df.loc[df['mdse_dept_ref_i'] == 47] num_items = new_df.groupby('week_end_date').size() avg_abs_error = new_df.groupby(['week_end_date'])['ABSError'].mean() new_df = num_items.to_frame().join(avg_abs_error.to_frame())

2条回答

网友

1楼 · 编辑于 2024-09-29 21:37:27

我认为您需要^{}+^{}，然后rename列和最后^{}到原始df：

df1 = df.groupby(['mdse_dept_ref_i','week_end_date'])['ABSError'].agg(['size','mean'])
d = {'size':'total', 'mean':'ABSError mean'}
df1 = df1.rename(columns=d)
print (df1)
                               total  ABSError mean
mdse_dept_ref_i week_end_date                      
47              3/25/17            3      39.988728
80              3/25/17            1       1.791748
204             3/25/17            1   12975.863000

df = df.join(df1, on=['mdse_dept_ref_i','week_end_date'])
print (df)
   mdse_item_i  mdse_clas_i  mdse_dept_ref_i  actual_sls week_end_date  \
0     19084539           30               47           0       3/25/17   
1     19517957           43               47           3       3/25/17   
2     19378250            0              204        1644       3/25/17   
3     19704764           43               47           0       3/25/17   
4     19119951            8               80          17       3/25/17   

   rnn_fcst_sls forecast_release_date      ABSError  total  ABSError mean  
0     48.520298               3/31/17     48.520298      3      39.988728  
1     44.795605               3/31/17     41.795605      3      39.988728  
2  14619.863000               3/31/17  12975.863000      1   12975.863000  
3     29.650280               3/31/17     29.650280      3      39.988728  
4     18.791748               3/31/17      1.791748      1       1.791748

网友

2楼 · 编辑于 2024-09-29 21:37:27

Pandas的groupby允许您按多个字段进行分组：

g = df.groupby(['mdse_dept_ref_i','week_end_date'])
num_items = g.size().to_frame('num_items')
avg_abs_error = g['ABSError'].mean()
df0 = pd.concat((num_items,avg_abs_error), axis = 1).reset_index()
df.merge(df0)

实际上，您可以将参数as_index = False传递给.groupby，但这在使用.size()时没有效果，因此我们必须稍后重置索引。你知道吗

相关问题更多 >

编程相关推荐

热门问题

热门文章

基于组创建新的数据帧

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >