擅长:python、mysql、java
<p>您可以使用<a href="https://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.DataFrame.value_counts.html" rel="nofollow noreferrer">value_counts</a></p>
<p>这将为您提供每封电子邮件的计数(作为一个系列)。然后遍历该系列并删除仅包含1个值的任何行</p>
<p>完整代码如下:</p>
<pre><code>for index, value in df.Email.value_counts().iteritems():
if value == 1:
df = df[df.Email != index]
</code></pre>
<p><strong>更新</strong>
我不知道duplicated til指出了什么,所以看起来最好的方法是:</p>
<pre><code>df[df.Email.duplicated(keep=False)]
</code></pre>