当每个农场有1-4个品种,但同一农场上不能有两个具有相同ripening
索引的品种时,如何从相同列中为苹果variety
填充缺失值?假设该列包含所有可能的场景
例如,在下面的示例中,帝国和霍尼克里斯普具有相同的ripening
,但它们来自不同的农场
样本df
(较大数据帧的一部分):
df = pd.DataFrame(
{'farm': [419,382, 382, 382, 411, 411, 411],
'variety': ['Gala', 'Gala', 'Empire', '', 'Honeycrisp', '', 'Fuji'],
'ripening':[2,2,3,3,3,3,6],
'D': np.random.randn(7)*10,
'E': list('abcdefg')
}
)
df
Out[223]:
farm variety ripening D E
0 419 Gala 2 12.921246 a
1 382 Gala 2 -2.776150 b
2 382 Empire 3 3.551226 c
3 382 3 2.715187 d
4 411 Honeycrisp 3 -13.557640 e
5 411 3 -11.525100 f
6 411 Fuji 6 -3.660661 g
我的期望输出:
farm variety ripening D E
0 419 Gala 2 12.921246 a
1 382 Gala 2 -2.776150 b
2 382 Empire 3 3.551226 c
3 382 Empire 3 2.715187 d
4 411 Honeycrisp 3 -13.557640 e
5 411 Honeycrisp 3 -11.525100 f
6 411 Fuji 6 -3.660661 g
使用:
相关问题 更多 >
编程相关推荐