擅长:python、mysql、java
<p>我认为<code>pandas</code>非常适合这份工作</p>
<p>安装
<code>pip3 install pandas</code></p>
<p>用法</p>
<pre><code>import pandas as pd
df = pd.read_csv("data.csv")
df[df.duplicated(['ID'], keep=False)] #gives you all the duplicates
</code></pre>
<p><code>keep</code>:{'first','last',False},默认值为'first'</p>
<ul>
<li>第一:将重复项标记为True,但第一次出现的除外</李>
<li>最后:将重复项标记为True,但最后一次出现的除外</李>
<li>False:将所有副本标记为True</李>
</ul>