使用5层组合查找数据帧的子集包含特定的5层组合，每列标识5个参与者中的一个

offplayer1 offplayer2 offplayer3 offplayer4 offplayer5 defplayer1 defplayer2 defplayer3 defplayer4 defplayer5 possessions points 0 1 2 3 4 5 11 12 13 14 15 5 5 1 1 2 3 4 6 11 12 13 14 15 4 4 2 2 3 4 5 6 11 12 13 14 15 3 5

df = pd.DataFrame(np.array([[1,2,3,4,5,11,12,13,14,15,5,5],[1,2,3,4,6,11,12,13,14,15,4,4],[2,3,4,5,6,11,12,13,14,15,3,5],[1,2,3,4,5,11,12,13,14,16,5,5],[1,2,3,4,5,21,22,23,24,25,10,10],[11,12,13,14,15,21,22,23,24,25,5,5]]),columns=['offplayer1','offplayer2','offplayer3','offplayer4','offplayer5','defplayer1','defplayer2','defplayer3','defplayer4','defplayer5','possessions','points']) df2 = pd.DataFrame(np.array([[1,2,3,4,5,11,12,13,14,15,5,5],[1,2,3,4,6,11,12,13,14,15,4,4],[2,3,4,5,6,11,12,13,14,15,3,5]]),columns=['offplayer1','offplayer2','offplayer3','offplayer4','offplayer5','defplayer1','defplayer2','defplayer3','defplayer4','defplayer5','possessions','points'])

1条回答

网友

1楼 · 发布于 2024-10-02 04:32:41

如果我理解正确的话，您应该能够基于offplayer列为每个df创建一个新索引，然后set_index，并将布尔索引与.isin一起使用。我稍微修改了一下你的样品，让你看看

# modified your sample data a little

df = pd.DataFrame(np.array([[1,2,3,4,5,11,12,13,14,15,5,5],
                            [1,2,3,4,6,11,12,13,14,15,4,4],
                            [1,2,3,4,5,11,12,13,14,16,3,5],
                            [2,3,4,5,6,11,12,13,14,15,5,5], 
                            [1,2,3,4,5,11,12,13,14,17,5,5],
                            [1,2,3,4,7,11,12,13,14,17,5,5]]),
                  columns=['offplayer1','offplayer2','offplayer3','offplayer4','offplayer5',
                           'defplayer1','defplayer2','defplayer3','defplayer4','defplayer5',
                           'possessions','points'])

# def players your are looking for
defplayers = [11,12,13,14,15]

# create df2 through boolean indexing
df2 = df[df[df.columns[5:10]].isin(defplayers).all(1)]

# create new indices
df_idx = df.columns[:5].values.tolist()
df2_idx = df2.columns[:5].values.tolist()

# boolean indexing to filter df
df[df.set_index(df_idx).index.isin(df2.set_index(df2_idx).index)]

相关问题更多 >

编程相关推荐

热门问题

热门文章