擅长:python、mysql、java
<p>您可以使用<code>pd.DataFrame.groupby</code>的<code>filter</code>方法。
这允许您传递一个函数,该函数指示是否应过滤子帧(在这种情况下,如果相关列中包含超过40%的NAN)。要获取该信息,可以使用<code>numpy</code>将NAN计数为<code>getNanFraction</code>:</p>
<pre class="lang-py prettyprint-override"><code>def getNanFraction(df):
nanCount = np.sum(np.isnan(df.drop("inn", axis=1).values))
return nanCount/len(df)
df.groupby("inn").filter(lambda x: getNanFraction(x) < 0.4 )
</code></pre>