Pandas时间序列数据帧缺失值

2024-05-05 02:28:07 发布

您现在位置:Python中文网/ 问答频道 /正文

我有一个2008-2015年总销售额的数据集。我每天都有一个条目,因此我有一个created a pandas DataFrame和一个销售列。看起来像这个enter image description here

问题是我缺少2010年大部分时间的数据。这些丢失的值当前由0.0表示,因此如果我绘制数据帧

enter image description here

我想尝试2016年的预测值,可能使用ARIMA模型,所以我采取的第一步是对这个时间序列进行分解

enter image description here

显然,如果我把2010年留在数据框中,任何尝试过的预测都会被明显的(尽管是错误的)销售下降所扭曲。在

在这种情况下,推荐的方法是什么?我想我应该把2010年的数据全部删除,但是我不知道我的时间序列从2009年到2011年是否有效。我不想填充缺失的值,因为我不相信我能准确地填充。在

不过,如果我只删除2010年,这个情节“填补”了2010年,这对我毫无帮助

sales = sales.drop(sales['2010'].index)

enter image description here


Tags: 数据模型dataframepandas错误时间绘制情况