如何删除重复ID的特定列中的数据？

2条回答

网友

1楼 · 编辑于 2024-09-21 11:40:44

您可以使用np.where：

In[25]:df['State']=np.where(df['Name'].duplicated(keep=False),np.nan,df['State'])

In[26]:df
Out[26]: 
   ID   Name State
0   1   John   NaN
1   1   John   NaN
2   2  Smith    NE
3   3  Janet   NaN
4   3  Janet   NaN
5   3  Janet   NaN

时间：

%timeit df.loc[df.duplicated(subset=['ID'], keep=False), 'State'] = None
100 loops, best of 3: 2.32 ms per loop

%timeit df['State']=np.where(df['Name'].duplicated(keep=False),np.nan,df['State'])
1000 loops, best of 3: 657 µs per loop

网友

2楼 · 编辑于 2024-09-21 11:40:44

duplicated返回一个布尔掩码，其中行在subset中定义的列上重复。keep=False表示不应将第一个或最后一个重复项视为非重复项。然后使用loc允许我们分配到发生重复的行。你知道吗

df.loc[df.duplicated(subset=['ID'], keep=False), 'State'] = None

df

编程相关推荐

java如何在删除某些字符时使用getText
java如何在另一个垂直RecyclerView中实现水平RecyclerView
在JTextField java中使用swing-ENTER键
用于请求数据的用户界面Java弹出窗口
用于匹配Unicode模式的java正则表达式
php如何从java应用程序访问数据库，而无需在xampp上安装mysql服务器
java扫描maven插件中的自定义注释类
java如何在Google Protobufs中完全读取带有分隔消息的文件？
java在log4j中定义的所有log4j附加器。游戏中的属性
java如何按特定键的顺序处理事件

相关问题更多 >

编程相关推荐

热门问题

热门文章

如何删除重复ID的特定列中的数据？

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >