我有以下熊猫数据帧
code tank var nozzle_1 nozzle_2 nozzle_3 nozzle_tank
123 1 23.34 12.23 54.56 12.22 11
123 1 22.32 11.32 7.89 3.45 12
123 1 21.22 19.93 5.54 5.66 12
123 1 21.34 12.23 54.56 22.22 14
123 1 32.32 13.32 4.89 32.45 34
123 1 32.22 29.93 23.54 23.66 33
123 2 23.34 12.23 54.56 12.22 21
123 2 22.32 11.32 7.89 3.45 22
123 2 21.22 19.93 5.54 5.66 21
123 2 21.34 12.23 54.56 22.22 21
123 2 32.32 13.32 4.89 32.45 22
123 2 32.22 29.93 23.54 23.66 21
我想计算喷嘴1、喷嘴2、喷嘴3和喷嘴4与储罐上方var柱分组的相关性
我想要的数据帧是
code tank nozzle_1 nozzle_2 nozzle_3 nozzle_4
123 1 0.08 0.01 0.02 0.01
123 2 0.07 0.01 0.02 0.02
我在熊猫馆做跟踪器
cols= df.columns[df.columns.str.contains(pat='nozzle_\d+$', regex=True)]
cols= np.array(cols)
var_col = 'var'
tank = 'tank'
def corrVar(df, cols, var_col, tank):
final_df = pd.DataFrame()
for col in nozzles_to_scale:
corrs = (df[[col, tank]].groupby(tank).corrwith(df.var_col ).reset_index())
final_df = final_df.join(corrs)
return final_df
但它似乎不起作用,我们怎么能在熊猫身上做到呢?你知道吗
test = corrVar(df, cols, var, tank)
您可以使用:
编辑:每个组的每个
N
值的相关解决方案:测试组:
编辑:
函数应为一行:
相关问题 更多 >
编程相关推荐