重复信息

2024-09-30 16:36:02 发布

您现在位置:Python中文网/ 问答频道 /正文

我有一个包含列的df,[CPF,name,age]。 我需要找到基地上重复的公积金,并返回该人的名字连同公积金。 到目前为止我已经做到了

    TrueDuplicat = base.groupby(['CPF']).size().reset_index(name='count')
    TrueDuplicat = TrueDuplicat[TrueDuplicat['count']>1]

当我说:

    TrueDuplicat = TrueDuplicat[['name','CPF']]

我得到错误“['name']不在索引中”

我如何得到重复的公积金与人的名字

DF示例

CPF         name  age

38445675455  Alex  15

54785698574  Ana   25

38445675455  Bento 22

65878584558  Caio  33

Tags: namedfagebasesizeindexcount错误
1条回答
网友
1楼 · 发布于 2024-09-30 16:36:02

groupby之后,TrueDuplicat中没有name列。对于您发布的示例,TrueDuplicat是:

           CPF  count
0  38445675455      2

如果要查找与TrueDuplicat中的CPF值对应的名称,可以执行以下操作

df[df['CPF'].isin(TrueDuplicat['CPF'].tolist())]

以你为例,这将产生

           CPF   name  age
0  38445675455   Alex   15
2  38445675455  Bento   22

相关问题 更多 >