有没有办法根据数据帧中前一列之间的关系来创建列？

| Employee_ID | Manager_ID | |:-----------:|:----------:| | E068 | E067 | | E071 | E067 | | E229 | E069 | | E248 | E144 | | E226 | E223 | | E236 | E241 | | E066 | E001 | | E067 | E001 | | E144 | E001 | | E223 | E001 | | E069 | E066 |

| Employee ID | Manager ID | Level 1 | Level 2 | Head of Manager | |:-----------:|:----------:|---------|---------|-----------------| | E068 | E067 | E001 | | E001 | | E071 | E067 | E001 | | E001 | | E229 | E069 | E066 | E001 | E001 | | E248 | E144 | E001 | | E001 | | E226 | E223 | E001 | | E001 | | E236 | E241 | | | E241 | | E066 | E001 | | | E001 | | E067 | E001 | | | E001 | | E144 | E001 | | | E001 | | E223 | E001 | | | E001 |

1条回答

网友

1楼 · 发布于 2024-09-26 18:03:10

我们可以使用^{}，循环在没有充满NaN值的列时执行。使用^{}、^{}和^{}检查：

i=1
df['Level 0']=df['Manager_ID']
while df.notna().any().all():
    df[f'Level {i}']=df[f'Level {i-1}'].map(df.set_index('Employee_ID')['Manager_ID'])
    i+=1

df=df.rename(columns={f'Level {i-1}':'Header of Manager'}).drop('Level 0',axis=1)
df['Header of Manager']=df[f'Level {i-2}'].bfill().ffill()

print(df)

输出：

   Employee_ID Manager_ID Level 1 Level 2 Header of Manager
0         E068       E067    E001     NaN              E001
1         E071       E067    E001     NaN              E001
2         E229       E069    E066    E001              E001
3         E248       E144    E001     NaN              E001
4         E226       E223    E001     NaN              E001
5         E236       E241     NaN     NaN              E001
6         E066       E001     NaN     NaN              E001
7         E067       E001     NaN     NaN              E001
8         E144       E001     NaN     NaN              E001
9         E223       E001     NaN     NaN              E001
10        E069       E066    E001     NaN              E001

我们可以这样简化：

i=1
df['Level 0']=df['Manager_ID']
while df.notna().sum().ne(1).all():
    df[f'Level {i}']=df[f'Level {i-1}'].map(df.set_index('Employee_ID')['Manager_ID'])
    i+=1
df=df.drop('Level 0',axis=1)
df['Header of Manager']=df.loc[:,f'Level {i-1}'].ffill().bfill()

相关问题更多 >

编程相关推荐

热门问题

热门文章