擅长:python、mysql、java
<p>首先将根数据帧拆分为两个数据帧:</p>
<pre><code>df_true = data.filter(data.failed == True).alias("df1")
df_false =data.filter(data.failed == False).alias("df2")
</code></pre>
<p>然后进行完全外部连接,我们可以得到最终结果:</p>
^{pr2}$
<p>不需要做<code>groupby</code>,只需要额外的两个数据帧和连接。在</p>