有条件地子集数据帧

2024-09-28 20:16:20 发布

您现在位置:Python中文网/ 问答频道 /正文

如果您有任何关于如何更适合团队的建议,我们也将不胜感激

我有一个数据帧“golfdf”,它由两列组成,“Teams”和“Clubs”

           Teams   Clubs
0          Aiden   Right
1          Alexa   Right
2          Alina   NaN
3          Allison Right
4          Amity   Right
5          Antoine NaN
6          Ben     NaN
...
35         Connor  Right

我试图将数据帧随机排列成一个顺序,然后将数据帧分成四组,每组至少有两个,最多有三个NaN值

我洗牌时使用:

gdf = golfdf.sample(frac=1)

然后用下列方法分成四组:

n = int(len(gdf)/9)
groups_n = np.cumsum([0, n, n, n, n, n, n, n, n, len(gdf)-(8*n)])
d = {}
for i in range(9):
    d[i+1] = gdf.iloc[groups_n[i]:groups_n[i+1]]

输出如预期:

     Teams Clubs
8    Breanne NaN
5    Antoine NaN
27   Noah    NaN
16   Ellen  Left
     Teams Clubs
20   Helen   NaN
22   Keegan  NaN
28   Payton  NaN
32   Sean    NaN
...

但是我不知道如何添加一个指定约束的条件。如果我遗漏了任何相关信息,请告诉我

谢谢


Tags: 数据rightlennan团队建议alexagroups