假设我在一个数据框中有两列,其中一列是不完整的。在
df = pd.DataFrame({'a': [1, 2, 3, 4], 'b':[5, '', 6, '']})
df
Out:
a b
0 1 5
1 2
2 3 6
3 4
有没有一种方法可以用a
列中的相应值填充b
列中的空值,同时保留b
列的其余部分不变?
这样就可以在不遍历列的情况下获得?在
^{pr2}$
我想你可以用apply方法,但我不确定。作为参考,我处理的数据集相当大(appx1gb),这就是为什么迭代-我的第一次尝试不是一个好主意。在
Tags:
您可以使用
pd.Series.where
使用df.b
的布尔版本,因为''
解析为False
如果空格是空字符串,则可以
但是如果空白是
^{pr2}$NaNs
,则可以使用fillna
你可以用np.哪里要计算df.b,如果它不为空,则保留其值,否则使用df.a。在
相关问题 更多 >
编程相关推荐