Pandas：比较行值并修改下一列的行值

A B 0 xyz Lena 1 NaN J.Brooke 2 NaN B.Izzie 3 NaN B.Rhodes 4 NaN J.Keith .....

A B 0 xyz Lena 1 old J.Brooke 2 new B.Izzie 3 new B.Rhodes 4 old J.Keith .....

3条回答

网友

1楼 · 编辑于 2024-06-29 00:57:19

使用pd.Series.fillna：

df['A'].fillna(df['B'].str[0].replace({'J': 'old', 'B': 'new'}))

输出：

     A         B
0  xyz      Lena
1  old  J.Brooke
2  new   B.Izzie
3  new  B.Rhodes
4  old   J.Keith

网友

2楼 · 编辑于 2024-06-29 00:57:19

如果需要按条件设置新值，请将^{}与^{}一起使用：

m1 = df['B'].str.startswith('B')
m2 = df['B'].str.startswith('J')

如果还需要通过^{}测试缺失值链条件：

m1 = df['B'].str.startswith('B') & df['A'].isna()
m2 = df['B'].str.startswith('J') & df['A'].isna()

df['A'] = np.select([m1, m2], ['new','old'], df['A'])
print (df)
     A         B
0  xyz      Lena
1  old  J.Brooke
2  new   B.Izzie
3  new  B.Rhodes
4  old   J.Keith

或者使用^{}：

df.loc[m1, 'A'] = 'new'
df.loc[m2, 'A'] = 'old'

网友

3楼 · 编辑于 2024-06-29 00:57:19

尝试使用loc
我添加了.isnull（）检查，因为如果colA中已经存在某些内容，则不会被替换，但如果不希望，则可以忽略该检查

import pandas 
df = pd.DataFrame(data={'colA':["xyz",np.nan,np.nan,np.nan,np.nan],
                   "colB":['Lena','J.Brooke','B.Izzie','B.Rhodes','J.Keith']})

df.loc[(df['colA'].isnull()) &(df['colB'].str.startswith("B")),"colA"] = "new"
df.loc[(df['colA'].isnull()) &(df['colB'].str.startswith("J")),"colA"] = "old"
print(df)

   colA      colB
0  xyz      Lena
1  old  J.Brooke
2  new   B.Izzie
3  new  B.Rhodes
4  old   J.Keith

相关问题更多 >

编程相关推荐

热门问题

热门文章

Pandas：比较行值并修改下一列的行值

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >