仅显示用户已获取的新书。忽略重复的

2024-10-03 06:31:32 发布

您现在位置:Python中文网/ 问答频道 /正文

我有一个带有用户id和图书id的数据框

数据:

Userid bookid
    403   B053
    403   B103
    403   B053
    403   B053
    1711  B008
    1711  B171
    1711  B008
    1711  B008
    1200  B008
    1200  B171

在用户id相同但图书id不同的情况下,如何获取数据

我试过这样的方法:

df[(df.userid == df.userid) & (df.bookid != df.bookid)]

它只返回空结果

预期选项:

Userid bookid
    403   B053
    403   B103
    1711  B008
    1711  B171
    1200  B008
    1200  B171

多个用户可能在这里使用同一本书。所以在这里删除副本是行不通的


Tags: 数据方法用户iddf选项情况图书
1条回答
网友
1楼 · 发布于 2024-10-03 06:31:32

这应该一直有效。使用userid和bookid删除重复项,然后仅使用userid查找重复项

df = df.drop_duplicates(['userid','bookid'])

df = df[df.duplicated(subset=['userid'])]

相关问题 更多 >