如何根据某些条件部分填充缺失值？

print(train.shape) (54808, 6) employee_id 0 name 0 education 2409 age 0 Salary_hike 4124 length_of_service 0

train = pd.DataFrame({'employee_id':[103,101,103,104,105,106,107,108,109,110], 'Name':['A','B','C','D','E','F','G','H','I','J'], 'Age' :[20,30,21,24,25,22,27,23,24,21], 'length_of_service':[1,2,1,4,5,1,7,1,2,1], 'Salary_hike':[np.nan,5, np.nan, 6, 7,1,9,1,4,np.nan] , })

train[(train.length_of_service <=1) & (train['Salary_hike'].isnull())] employee_id Name Age length_of_service Salary_hike 0 103 A 20 1 NaN 2 103 C 21 1 NaN 9 110 J 21 1 NaN

1条回答

网友

1楼 · 发布于 2024-09-24 22:26:09

我相信你需要：

train = pd.DataFrame({'length_of_service':[-1,5,4,-8,9,-3,0], 
                      'Salary_hike':[10,np.nan, 5, np.nan, np.nan, 8, np.nan]})
train.loc[(train.length_of_service <=1) & (train['Salary_hike'].isnull()),'Salary_hike'] = 0

print (train)
   length_of_service  Salary_hike
0                 -1         10.0
1                  5          NaN
2                  4          5.0
3                 -8          0.0
4                  9          NaN
5                 -3          8.0
6                  0          0.0

如果值为-1，则需要设置：

train = pd.DataFrame({'length_of_service':[-1,5,4,-1,9,-3,-1], 
                      'Salary_hike':[10,np.nan, 5, np.nan, np.nan, 8, np.nan]})
train.loc[(train.length_of_service==-1) & (train['Salary_hike'].isnull()),'Salary_hike'] = 0

print (train)
   length_of_service  Salary_hike
0                 -1         10.0
1                  5          NaN
2                  4          5.0
3                 -1          0.0
4                  9          NaN
5                 -3          8.0
6                 -1          0.0

相关问题更多 >

编程相关推荐

热门问题

热门文章