仅当值存在一次时应用命令

df = pd.DataFrame(data={'a_ans':[0,1,1,10,11], 'a_num': [1,8,90,2,8], 'b_ans': [0,10,139,10,18], 'b_num': [15,43,90,14,87]}).astype(float) out=[] for i in ['a_', 'b_']: pairs = (df.loc[:,df.columns.str.startswith(i)]) # pair columns mask1 = pairs[i+'ans'] == 10 # mask values equal to 10 mask2 = pairs[i+'ans'].eq(pairs[i+'ans'].mask(mask1).max())# get the next highest value pairs = pairs.mask(mask1, 1001).mask(mask2, 1002) # replacing values out.append(pairs)

2条回答

网友

1楼 · 编辑于 2024-09-27 07:32:20

您可以使用^{}获取每列中每行值的出现次数：

if pairs[i+'ans'].value_counts()[10] == 1:
    # apply mask logic

网友

2楼 · 编辑于 2024-09-27 07:32:20

以下修改可能有用，但不清楚下一个最接近或最高的值是什么

df = pd.DataFrame(data={'a_ans':[0,1,1,10,11],
                        'a_num': [1,8,90,2,8],
                        'b_ans': [0,10,139,10,18],
                        'b_num': [15,43,90,14,87]}).astype(float)


out=[]

for i in ['a_', 'b_']:
    
    pairs = df.loc[:,df.columns.str.startswith(i+"ans")] # for only _ans columns
    if len(pairs[pairs[i+'ans'] == 10]) == 1: # for only one ten  

        mask1 = pairs[i+'ans'] == 10 # mask values equal to 10 
        mask2 = pairs[i+'ans'].eq(pairs[i+'ans'].mask(mask1).max()) 
        pairs = pairs.mask(mask1, 1001).mask(mask2, 1002)
        out.append(pairs)

相关问题更多 >

编程相关推荐

热门问题

热门文章