我有一个带有日期索引、Sales列和storenumber列的数据框。我想为缺少销售数据的商店填写缺少的销售值。你知道吗
例如,假设我想用下面10号店当年的平均销售额来填写缺失的销售值。假设我拥有的10号店2015年的销售数据是:
Sales| Store Number| Date
4000 | 10 | 2015-01-01
6000 | 10 | 2015-01-02
10000| 10 | 2016-01-01
如果这是10号店2015年的唯一销售数据,那么我将创建363个新行,对应于日期2015-01-03到2015-12-31,平均销售额(40006000)=5000。我怎样才能有效地做到这一点?你知道吗
这可以通过
reindex
来获得每个商店的所有日期,fillna
用平均销售额替换丢失的日期。你知道吗打印(df)
因为
reindex
是笛卡尔积,而不是慢慢地重新索引每个组,我们可以处理的商店从来没有任何销售和下降后,事实。你知道吗groupby
年份和门店号找到平均销售额。你知道吗它的编码应该相当简单。。你知道吗
相关问题 更多 >
编程相关推荐