将数据帧除以两个DF值\u counts（）

2条回答

网友

1楼 · 编辑于 2024-09-29 21:56:37

将^{}和^{}与keep=False一起使用：

给定df：

   name      rs  number
0    11    5566   64882
1    41  534326    5345
2    11    5566    3312
3    44    2341    5553
4     1    6223    2333

使用drop_duplicates：

uniq_df = df.drop_duplicates('rs', False)
print(uniq_df)

   name      rs  number
1    41  534326    5345
3    44    2341    5553
4     1    6223    2333

使用duplicated：

dup_df = df[df.duplicated('rs', False)]
print(dup_df)

   name    rs  number
0    11  5566   64882
2    11  5566    3312

或者更简单，只使用df.duplicated('rs', False)：

ind = df.duplicated('rs', False)
print(df[~ind])

   name      rs  number
1    41  534326    5345
3    44    2341    5553
4     1    6223    2333

print(df[ind])
   name    rs  number
0    11  5566   64882
2    11  5566    3312

网友

2楼 · 编辑于 2024-09-29 21:56:37

您可以将两个df保存在一个dict中：

d={f'df_{i}':g for i,g in df.groupby(
     np.where(df.rs.duplicated(keep=False),'duplicated','Unique'))}

print(d['df_Unique'])

   name      rs  number
1    41  534326    5345
3    44    2341    5553
4     1    6223    2333

print(d['df_duplicated'])

   name    rs  number
0    11  5566   64882
2    11  5566    3312

相关问题更多 >

编程相关推荐

热门问题

热门文章

将数据帧除以两个DF值\u counts（）

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >