<p>我只想选择DF的主要部分。例如,给定</p>
<pre><code>id_B, supportProgress
id1, A
id1, A
id1, A
id1, A
id1, A
id1, B
id1, B
</code></pre>
<p>输出为:</p>
<pre><code>id_B, supportProgress
id1, A
id1, A
id1, A
id1, A
id1, A
</code></pre>
<p>我不能应用一个简单的过滤器,因为我不知道supportProgress的值是什么。在另一个DF中,可以是supportProgress=C,C,C,C,D,D,并且,我只想选择对应于C,C,C,C,C的部分</p>
<p>我的想法是做一个<code>df.groupby(['supportProgress'])</code>并选择覆盖<code>len(df)</code>80%以上的部分</p>