擅长:python、mysql、java
<p>实际上,给定的链接使用了<code>apply</code>,这通常比较慢。下面是一个带有<code>np.sort</code>的解决方案:</p>
<pre><code>s = np.sort(df[['col1','col2']], axis=1)
df.groupby([s[:,0],s[:,1]])['count'].sum().reset_index()
</code></pre>
<p>输出:</p>
<pre><code> level_0 level_1 count
0 A B 15
1 A C 7
2 A D 9
3 B C 4
4 C D 8
5 D E 5
</code></pre>