我有以下熊猫数据帧
code tank var nozzle_1 nozzle_2 nozzle_3
123 1 23.34 12.23 54.56 12.22
123 1 22.32 11.32 7.89 3.45
123 1 21.22 19.93 5.54 5.66
123 1 21.34 12.23 54.56 22.22
123 1 32.32 13.32 4.89 32.45
123 1 32.22 29.93 23.54 23.66
123 2 23.34 12.23 54.56 12.22
123 2 22.32 11.32 7.89 3.45
123 2 21.22 19.93 5.54 5.66
123 2 21.34 12.23 54.56 22.22
123 2 32.32 13.32 4.89 32.45
123 2 32.22 29.93 23.54 23.66
我想找出喷嘴1、喷嘴2、喷嘴3与var列的相关性,按储罐分组,每3行取一次相关性
我想要的数据帧是
code tank nozzle_1 nozzle_2 nozzle_3
123 1 0.20 0.30 0.23
123 1 0.12 0.08 0.12
123 2 0.14 0.12 0.01
123 2 0.15 0.04 0.13
我跟熊猫在一起
cols= df.columns[df.columns.str.contains(pat='nozzle_\d+$', regex=True)]
cols= np.array(cols)
def corrVar(df, cols):
for col in cols_to_scale:
for i in range(0, df.shape[0], 3):
df[col] = df.groupby('tank')[col, 'var'].corr()
return df
测试=corrVar(df,cols)
但是,它并没有给我想要的结果。我们怎样才能在熊猫身上做到呢?你知道吗
对此没有直接的解决方案,因此我的分析如下:
nozzle
开头的列的列索引var
的列索引GroupBy
并计算每个{Concat
两个半帧作为final
数据帧彼此重叠输出
如果要正确重命名列
相关问题 更多 >
编程相关推荐