用近数填充数据框中缺少的值

2024-09-30 14:16:52 发布

您现在位置:Python中文网/ 问答频道 /正文

我有以下数据帧:

df = pd.DataFrame({'id': {3002: 10001,
  3003: 10002,
  3004: 10003,
  3005: 10004,
  3006: 10005,
  3007: 10006,
  3008: 10007,
  3009: 10008,
  3010: 10009,
  3011: 10010,
  3012: 10011,
  3013: 10012,
  3014: 10013,
  3015: 10014,
  3016: 10015,
  3017: 10016,
  3018: 10017,
  3019: 10018,
  3020: 10019,
  3021: 10020},
 'value': {3002: 1669.0,
  3003: 1264.0,
  3004: nan,
  3005: 1411.0,
  3006: 1224.0,
  3007: 1316.0,
  3008: 1736.0,
  3009: nan,
  3010: 1276.0,
  3011: nan,
  3012: nan,
  3013: nan,
  3014: nan,
  3015: 1790.0,
  3016: nan,
  3017: nan,
  3018: nan,
  3019: 1726.0,
  3020: nan,
  3021: nan}})

我想用最近的id中的一个来填充缺失的值,如果两个值在相同的距离,那么我要使用平均值。在

例如

id 10008是NaN,那么我想用10009和10007的平均值填充单元格:(1736.0+1276.0)/2

对于ID10015,最接近的值是10014,所以我将直接使用该值:1790.0

enter image description here

我怎样才能有效地完成这个任务?在


Tags: 数据id距离dataframedfvaluenan平均值
2条回答

这有点棘手,但您可以使用interpolate()(只能用于系列):

df['value'] = df['value'].interpolate(method='slinear').interpolate(method='linear')

第二次插值只需要填充序列中的最后一个nan。在

df.value = df.value.interpolate(method='nearest')

相关问题 更多 >

    热门问题