擅长:python、mysql、java
<p>你对复制品的定义和熊猫用的不一样。在pandas中,如果对应的条目相同,则两行被认为是重复的。在下面的示例中,第1行和第2行不重复,因为它们对应的变量的值不同,而第3行和第4行是重复的。在</p>
<pre><code>df = {'source':['acc1.yyy', 'acx1.xxx', 'acc1.xxx', 'acc1.xxx'], 'target': ['acx1.xxx', 'acc1.yyy', 'acc1.yyy', 'acc1.yyy']}
df = pd.DataFrame(df)
df
# source target
# 0 acc1.yyy acx1.xxx
# 1 acx1.xxx acc1.yyy
# 2 acc1.xxx acc1.yyy
# 3 acc1.xxx acc1.yyy
df.drop_duplicates()
# source target
# 0 acc1.yyy acx1.xxx
# 1 acx1.xxx acc1.yyy
# 2 acc1.xxx acc1.yyy
</code></pre>
<p>对于您所提到的情况,创建一个新列,它是源列和目标列的元组。试试下面的方法</p>
^{pr2}$