以其他列组的最大值为条件计算新列

Factor1 Factor2 evenSpread dropONE Place Instance Count ID Home 1 7 1 20 18 14.285714 16.666667 2 22 19 14.285714 16.666667 4 36 40 14.285714 16.666667 5 32 30 14.285714 16.666667 6 1 7 14.285714 16.666667 7 99 90 14.285714 16.666667 8 5 9 14.285714 16.666667 2 8 1 10 8 12.500000 14.285714 3 20 19 12.500000 14.285714 4 30 35 12.500000 14.285714 5 40 55 12.500000 14.285714 6 70 50 12.500000 14.285714 7 50 60 12.500000 14.285714 8 60 52 12.500000 14.285714 9 70 88 12.500000 14.285714

Factor1 Factor2 evenSpread dropONE Place Instance Count ID Home 1 7 1 20 18 14.285714 16.666667 2 22 19 14.285714 16.666667 4 36 40 14.285714 16.666667 5 32 30 14.285714 16.666667 6 1 7 14.285714 16.666667 7 99 90 14.285714 0 8 5 9 14.285714 16.666667 2 8 1 10 8 12.500000 14.285714 3 20 19 12.500000 14.285714 4 30 35 12.500000 14.285714 5 40 55 12.500000 14.285714 6 70 50 12.500000 0 7 50 60 12.500000 14.285714 8 60 52 12.500000 14.285714 9 70 88 12.500000 14.285714

import numpy as np import pandas as pd my_data = {'Place': ['Home', 'Home', 'Home', 'Home', 'Home', 'Home', 'Home', 'Home', 'Home', 'Home', 'Home', 'Home', 'Home', 'Home', 'Home'], 'Instance': [1, 1, 1, 1, 1, 1, 1, 2, 2, 2, 2, 2, 2, 2, 2], 'Count': [7, 7, 7, 7, 7, 7, 7, 8, 8, 8, 8, 8, 8, 8, 8], 'ID': [1, 2, 4, 5, 6, 7, 8, 1, 3, 4, 5, 6, 7, 8, 9], 'Factor1': [20, 22, 36, 32, 1, 99, 5, 10, 20, 30, 40, 70, 50, 60, 70], 'Factor2': [18, 19, 40, 30, 7, 90, 9, 8, 19, 35, 55, 50, 60, 52, 88], } df = pd.DataFrame(my_data) df = df[['Place', 'Instance', 'Count', 'ID', 'Factor1', 'Factor2']] df.set_index(['Place', 'Instance', 'Count', 'ID'], inplace=True) print(df) df['evenSpread'] = 100 / df.index.get_level_values('Count') df['dropONE'] = 100 / (df.index.get_level_values('Count') - 1) # WRONG AS WRITTEN print(df) # df['dropONE'] = np.where(df['Factor1'] == df.groupby(level=[0, 1, 2])['Factor1'].max(), 0, 1) print(df) print(df.groupby(level=[0, 1, 2])['Factor1'].max())

Factor1 Factor2 evenSpread dropONE Place Instance Count ID Home 1 7 6 1 7 14.285714 16.666667 8 5 9 14.285714 16.666667 1 20 18 14.285714 16.666667 2 22 19 14.285714 16.666667 5 32 30 14.285714 16.666667 4 36 40 14.285714 16.666667 7 99 90 14.285714 16.666667 2 8 1 10 8 12.500000 14.285714 3 20 19 12.500000 14.285714 4 30 35 12.500000 14.285714 5 40 55 12.500000 14.285714 7 50 60 12.500000 14.285714 8 60 52 12.500000 14.285714 6 70 88 12.500000 14.285714 9 70 50 12.500000 14.285714

1条回答

网友

1楼 · 发布于 2024-09-28 22:35:59

经过数小时的探索和反复试验，我学到了一些东西。分类是关键。以下内容改编自This question

def replace_first_x(group):
    group.iloc[-1, -1:] = 0
    return group

df = df.groupby(level=[0, 1, 2]).apply(replace_first_x)
print(df)

还有我的作品！你知道吗

                         Factor1  Factor2  evenSpread    dropONE
Place Instance Count ID                                         
Home  1        7     6         1        7   14.285714  16.666667
                     8         5        9   14.285714  16.666667
                     1        20       18   14.285714  16.666667
                     2        22       19   14.285714  16.666667
                     5        32       30   14.285714  16.666667
                     4        36       40   14.285714  16.666667
                     7        99       90   14.285714   0.000000
      2        8     1        10        8   12.500000  14.285714
                     3        20       19   12.500000  14.285714
                     4        30       35   12.500000  14.285714
                     5        40       55   12.500000  14.285714
                     7        50       60   12.500000  14.285714
                     8        60       52   12.500000  14.285714
                     9        70       88   12.500000  14.285714
                     6        70       50   12.500000   0.000000

我很好奇是否有任何内置的功能或更好的方法来做到这一点，虽然。这是可行的，但有点慢（df超过500k行）。你知道吗

相关问题更多 >

编程相关推荐

热门问题

热门文章