擅长:python、mysql、java
<p>一种方法是首先去掉连续的<code>Cookies</code>,然后在使用<code>duplicated</code>之前找到<code>Cookie</code>的位置,最后<code>groupby</code>cookie并得到总和:</p>
<pre><code>no_doubles = df[df.Cookie != df.Cookie.shift()]
no_doubles['dups'] = no_doubles.Cookie.duplicated()
no_doubles.groupby('Cookie').dups.sum()
</code></pre>
<p>这将为您提供:</p>
<pre><code>Cookie
A 2.0
B 1.0
C 0.0
D 2.0
E 0.0
Name: dups, dtype: float64
</code></pre>