擅长:python、mysql、java
<p>这是我为自己的目的所做的最干净的解决方案。在</p>
<p>创建一个列,将每一行合并到一个已排序的列表中</p>
<pre><code>df['sorted_row'] = [sorted([a,b]) for a,b in zip(df.InteractorA, df.InteractorB)]
</code></pre>
<p>无法删除列表上的重复项,因此该列应为字符串</p>
^{pr2}$
<p>删除重复项</p>
<pre><code>df.drop_duplicates(subset=['sorted_row'], inplace=True)
</code></pre>