擅长:python、mysql、java
<p>您只需要按<code>id</code>列进行分组,并在此基础上查找最频繁的数据(模式)</p>
<p>为了简化操作,您可以创建另一列<code>combined_str</code>:</p>
<pre><code>df['combined_str'] = df['string_col_A'] + df['string_col_B']
</code></pre>
<h2>按<code>id</code>分组并使用<code>pd.Series.mode</code>函数减少:</h2>
<pre><code>df = df.sort_values(by=['creation_date'])
df = df.groupby(['id'])['combined_str'].agg(most_common = ('combined_str', pd.Series.mode))
</code></pre>