擅长:python、mysql、java
<p>实际上可以试试<a href="http://docs.scipy.org/doc/numpy-1.10.1/reference/generated/numpy.unique.html" rel="nofollow">^{<cd1>}</a>。在numpyv1.9中,<code>unique</code>可以返回一些额外的值,比如<code>unique_indices</code>,<code>unique_inverse</code>,<code>unique_counts</code>。在</p>
<p>如果你想用熊猫,这将是相当简单,可能相当快。您可以使用<a href="http://pandas.pydata.org/pandas-docs/stable/groupby.html#filtration" rel="nofollow">groupby filter</a>。比如:</p>
<pre><code>out = df.groupby('timestamp').filter(lambda x: len(x) > 20)
</code></pre>