重采样:Python

2024-10-02 20:42:27 发布

您现在位置:Python中文网/ 问答频道 /正文

我正在尝试使用python预测零售销售时间序列。数据集包含以下属性, [订单日期] 船舶模式 段 客户ID 类别 产品ID 产品名称 销售额 数量 优惠 利润]。 在这里,我导入了数据集,并用时间序列数据建立了索引

prdct1 = prdct1.groupby('Order Date')['Sales'].sum().reset_index()
prdct1 = prdct1.set_index('Order Date')
prdct1.index

已为上述代码显示日期时间索引。 当我尝试将每个月初的日均销售额重新采样为时间戳时

y = prdct1['Sales'].resample('MS').mean()

我发现以下错误

Only valid with DatetimeIndex, TimedeltaIndex or PeriodIndex, but got an instance of 'Index'

有人能帮忙吗


Tags: 数据订单iddateindex客户属性时间
1条回答
网友
1楼 · 发布于 2024-10-02 20:42:27

我认为您需要DatetimeIndex通过转换列Order Date来解决问题,同时reset_indexwith set_index应该省略:

prdct1['Order Date'] = pd.to_datetime(prdct1['Order Date'])
prdct1 = prdct1.groupby('Order Date')['Sales'].sum()

然后:

y = prdct1.resample('MS').mean().reset_index()

相关问题 更多 >