从所有可能的特定列值组合中选择一个序列

method method_par1 variantB_option x y 0 m1 variantA NaN 2 13 1 m1 variantA NaN 1 11 2 m2 NaN NaN 1 7 3 m2 NaN NaN 5 3 4 m1 variantB 25 10 9 5 m1 variantB 25 5 3 6 m1 variantB 15 54 39 7 m1 variantB 15 1 4

df1 method method_par1 variantB_option x y 0 m1 variantA NaN 2 13 1 m1 variantA NaN 1 11 df2 method method_par1 variantB_option x y 2 m2 NaN NaN 1 7 3 m2 NaN NaN 5 3 df3 method method_par1 variantB_option x y 4 m1 variantB 25 10 9 5 m1 variantB 25 5 3 df4 method method_par1 variantB_option x y 6 m1 variantB 15 54 39 7 m1 variantB 15 1 4

2条回答

网友

1楼 · 编辑于 2024-10-02 04:21:01

您可能需要fillna

for x , y in df.fillna('NaN').groupby(['method','method_par1','variantB_option']):
    print(y)

  method method_par1 variantB_option  x   y
0     m1    variantA             NaN  2  13
1     m1    variantA             NaN  1  11
  method method_par1 variantB_option   x   y
6     m1    variantB              15  54  39
7     m1    variantB              15   1   4
  method method_par1 variantB_option   x  y
4     m1    variantB              25  10  9
5     m1    variantB              25   5  3
  method method_par1 variantB_option  x  y
2     m2         NaN             NaN  1  7
3     m2         NaN             NaN  5  3

d={ x:y.replace({'NaN':np.nan})   for x , y in df.fillna('NaN').groupby(['method','method_par1','variantB_option'])

网友

2楼 · 编辑于 2024-10-02 04:21:01

您可以使用groupby并对其进行迭代：

dfs = [v for k, v in df.groupby(['method', 'method_par1', 'variantB_option'])['x', 'y']]
dfs[0]
  method method_par1 variantB_option  x   y
0     m1    variantA             NaN  2  13
1     m1    variantA             NaN  1  11
dfs[1]
  method method_par1 variantB_option   x   y
6     m1    variantB              15  54  39
7     m1    variantB              15   1   4
dfs[2]
  method method_par1 variantB_option   x  y
4     m1    variantB              25  10  9
5     m1    variantB              25   5  3
dfs[3]
  method method_par1 variantB_option  x  y
2     m2         NaN             NaN  1  7
3     m2         NaN             NaN  5  3

如果您的NaN是实而不是数字，groupby将只返回不带NaN的三元组。在这种情况下，使用df.fillna()作为您的首选值

相关问题更多 >

编程相关推荐

热门问题

热门文章