如何删除概念上的重复项？

Player CurrentTeam PreviousTeam 0 James Team A Null 1 David Team B Null 2 George Team C Null 3 James Team B Team A 4 James Team C Team B ... ...

3条回答

网友

1楼 · 编辑于 2024-10-02 20:32:35

基于this answer中的技术，我们可以去掉任何作为（玩家，前一个团队）组合存在的（玩家，当前团队）组合

>>> df
   Player CurrentTeam PreviousTeam
0   James      Team A         Null
1   David      Team B         Null
2  George      Team C         Null
3   James      Team B       Team A
4   James      Team C       Team B

>>> old_teams = df[["Player", "PreviousTeam"]].rename(columns={"PreviousTeam": "Team"})
>>> all_teams = df[["Player", "CurrentTeam"]].rename(columns={"CurrentTeam": "Team"})
>>> current_teams = (pd.merge(all_teams, old_teams, indicator=True, how="outer")
                       .query("_merge == 'left_only'")
                       .drop("_merge", axis=1)
                       .reset_index(drop=True))
>>> current_teams
   Player    Team
0   David  Team B
1  George  Team C
2   James  Team C

网友

2楼 · 编辑于 2024-10-02 20:32:35

对于这种情况，一种可能的解决方案是将groupby与tail一起使用：

df = df.groupby('Player').tail(1)
print(df)

输出：

    Player CurrentTeam PreviousTeam
1   David       TeamB         Null
2  George       TeamC         Null
4   James       TeamC        TeamB

网友

3楼 · 编辑于 2024-10-02 20:32:35

使用^{}

new_df = df.drop_duplicates('Player', keep='last')
print(new_df)

如果要选中PreviousTeam，请使用：

df.loc[~df.groupby('Player')['PreviousTeam']
          .shift(-1)
          .eq(df['CurrentTeam'])]

输出

   Player CurrentTeam PreviousTeam
1   David      Team B         Null
2  George      Team C         Null
4   James      Team C       Team B

相关问题更多 >

编程相关推荐

热门问题

热门文章

如何删除概念上的重复项？

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >