擅长:python、mysql、java
<p>如果整个数据集的团队顺序不一致,则需要定义<code>match</code>列:</p>
<pre><code>df['match'] = df[['team1', 'team2']].apply(
lambda row: tuple(sorted(row.values)),
axis=1
)
</code></pre>
<p>元组是分组所必需的,因为它是可散列的</p>
<p>不清楚您想要什么输出,但这会让您接近您的结果:</p>
<pre><code>df.groupby('match')['winner'].value_counts()
</code></pre>
<p>输出:</p>
<pre><code>match winner
(CSK, KXIP) CSK 1
(DC, DD) DD 1
...
</code></pre>