我有一个2008-2015年总销售额的数据集。我每天都有一个条目,因此我有一个created a pandas DataFrame
和一个销售列。看起来像这个
问题是我缺少2010年大部分时间的数据。这些丢失的值当前由0.0
表示,因此如果我绘制数据帧
我想尝试2016年的预测值,可能使用ARIMA模型,所以我采取的第一步是对这个时间序列进行分解
显然,如果我把2010年留在数据框中,任何尝试过的预测都会被明显的(尽管是错误的)销售下降所扭曲。在
在这种情况下,推荐的方法是什么?我想我应该把2010年的数据全部删除,但是我不知道我的时间序列从2009年到2011年是否有效。我不想填充缺失的值,因为我不相信我能准确地填充。在
不过,如果我只删除2010年,这个情节“填补”了2010年,这对我毫无帮助
sales = sales.drop(sales['2010'].index)
目前没有回答
相关问题 更多 >
编程相关推荐