使用列名前缀将每列乘以它们的相对因子

网友

1楼 · 编辑于 2024-06-28 22:06:06

您可以通过一些奇特的数据帧重塑来实现这一点：

df.columns = pd.MultiIndex.from_arrays(zip(*df.columns.str.split('_')))
df=df.stack()
df_mul = df.filter(like='v').mul(df.filter(like='f').squeeze(), axis=0)
df_mul = df_mul.unstack().sort_index(level=1, axis=1)
df_mul.columns = [f'{i}_{j}' for i, j in df_mul.columns]
df_mul

输出：

    v1_m1  v2_m1  v3_m1  v1_m2  v2_m2  v3_m2
id                                          
1     0.0    2.0    2.0    0.4    1.2    2.4
2     2.4    2.4    3.2    1.4    2.8    2.8

详情：

在“\u1”上创建多索引列标题split
重塑数据帧stack，将m#改为行，留下四列f和三个v
使用filter，我们可以通过f选择v列和multiply 通过选择单个列并使用squeeze来创建序列从单列数据帧创建pd.Series
unstack将m#级别返回到列
使用将多索引列标题展平到单个级别具有列表理解的f字符串

网友

2楼 · 编辑于 2024-06-28 22:06:06

for m in range (1,maxm):
    for i in range (1,maxv):
        df["v{}_m{}".format(i,m)] = df["v{}_m{}".format(i,m)]*df["f_m{}".format(m)]
for m in range (1,maxm):
    df.drop(columns=["f_m{}".format(m)])

网友

3楼 · 编辑于 2024-06-28 22:06:06

假设您的矩阵是一个名为df的数据框架，如果您喜欢，我想推荐一种列表理解方法

import itertools

items = [(i[0][0],i[0][1].multiply(i[1][1]))
         for i in itertools.product(df.items(),repeat=2) 
         if (i[0][0][-2:]==i[1][0][-2:]) 
         and i[1][0][:1]=='f' 
         and i[0][0][:1]!='f']

df_mul = pd.DataFrame.from_dict({i[0]:i[1] for i in items})

对于这个问题的更大版本，它应该是最快的

解释-

为每列之间的叉积创建一个生成器，作为（c1，c2）元组
仅保留c1、c2和c2最后两个字母以“f”开头的列，而c1不以“f”开头（留下要作为单个元组操作的列）。类似这样的-[('v1_m1', 'f_m1'), ('v2_m1', 'f_m1'), ('v1_m2', 'f_m2')]
将列相乘，附加一个列名并将其保存为项（类似于df.items()的结构）
将项目转换为数据帧

相关问题更多 >

编程相关推荐

热门问题

热门文章

使用列名前缀将每列乘以它们的相对因子

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >