擅长:python、mysql、java
<ol>
<li>您可以创建一个组合两列的系列<code>s</code></li>
<li>返回最大计数的索引</li>
<li>按该索引过滤<em>注意:如果您使用的是早期版本的pandas,则从<code>.groupby</code>代码中取出<code>, sort=False</code>并在末尾进行排序</em></li>
</ol>
<p></p>
<pre><code>s = df['string_col_A'] + df['string_col_B']
df['max'] = df.groupby(['id',s])['id'].transform('count')
df = df.iloc[df.groupby('id', sort=False)['max'].idxmax().values].drop(['max', 'creation_date'], axis=1)
df
Out[1]:
id string_col_A string_col_B
0 x12ga STR_X1 STR_Y1
3 x21ab STR_X4 STR_Y4
5 x11aa STR_X3 STR_Y3
</code></pre>