Python: 将两个链接列拆分成新行

2024-07-07 08:13:36 发布

您现在位置:Python中文网/ 问答频道 /正文

我有以下数据帧:

N1   FF1; FF2                PP1; PP2
N2   FF3                     PP3
N3   FF4; FF5; FF6           PP4; PP5; PP6

专栏FF&;PP具有以下关系,每个FF都以相同的编号链接到PP,即FF1链接到PP1,依此类推

我需要的输出如下:

N1 FF1 PP1
N1 FF2 PP2
N2 FF3 PP3
N3 FF4 PP4
N3 FF5 PP5
N3 FF6 PP6

到目前为止,我尝试了以下方法:

df_copy = df["F","P"].str.split(";").apply(Series,1).stack()

然而,我收到一个键错误,并困惑于如何继续

非常新的编程,我非常感谢一些指导

谢谢


Tags: n2n3n1ff1ff3ff2pp2pp1
1条回答
网友
1楼 · 发布于 2024-07-07 08:13:36

对于Pandas/NumPy,应尽可能使用矢量化方法apply+pd.Series是一个低效的Python级循环

例如,使用^{}^{}

from itertools import chain

df = pd.DataFrame([['N1', 'FF1; FF2', 'PP1; PP2'],
                   ['N2', 'FF3', 'PP3'],
                   ['N3', 'FF4; FF5; FF6', 'PP4; PP5; PP6']])

split1, split2 = df[1].str.split('; '), df[2].str.split('; ')
n = split1.str.len()

res = pd.DataFrame({0: df[0].values.repeat(n.values),
                    1: list(chain.from_iterable(split1)),
                    2: list(chain.from_iterable(split2))})

print(res)

    0    1    2
0  N1  FF1  PP1
1  N1  FF2  PP2
2  N2  FF3  PP3
3  N3  FF4  PP4
4  N3  FF5  PP5
5  N3  FF6  PP6

相关问题 更多 >