擅长:python、mysql、java
<p>我会在<code>groupby</code>之前过滤阳性</p>
<pre><code>df = (not_cancelled[not_cancelled.arr_delay >0].groupby(['year','month','day'])['arr_delay']
.mean().reset_index()
)
df.head()
</code></pre>
<p>因为,在您的代码中,<code>df</code>是</strong>操作完成之后的一个单独的数据帧,并且</p>
^{pr2}$
<p>将相同的值赋给<code>df['avg_delay2']</code></p>
<p>编辑:与R类似,您可以使用<code>agg</code>一次性完成这两个操作:</p>
<pre><code>def mean_pos(x):
return x[x>0].mean()
df = (not_cancelled.groupby(['year','month','day'])['arr_delay']
.agg({'arr_delay': 'mean', 'arr_delay_2': mean_pos})
)
df.head()
</code></pre>