如何处理时间序列问题中的两个日期列?

2024-06-01 09:52:59 发布

您现在位置:Python中文网/ 问答频道 /正文

我有一个数据集,其中有两个日期列。有点像下面的桌子。火车票价;票价在不同的文件中&;有不同的日期

flt_number carrier flt_date flt_book_dt train_fare/pred_fare

123    L1    2018-01-01    2017-11-01    2015/NaN
123    L1    2018-01-01    2017-11-02     562/NaN
123    L1    2018-01-01    2017-11-03     562/NaN
...
123    L1    2018-01-01    2018-01-01    2015/NaN
123    L1    2018-02-01    2018-12-17     562/NaN
123    L1    2018-02-01    2018-12-18     562/NaN
...
123    L1    2018-04-01    2018-04-01    5055/NaN
123    L1    2018-05-01    2018-04-02     890/NaN
111    L2    2018-01-01    2017-11-15    1000/NaN
...

现在,即使我按flt\u date或flt\u book\u dt这两个日期对数据帧进行排序,也会丢失一些日期,但这两个日期都在移动&;有时也会重复,我们需要预测的是,在某个特定的飞行手册上,飞行日期的机票价格是多少

111    L2    2019-05-01    2019-03-10    ??

到目前为止,我所做的是,我计算了两列中所有缺失的日期;估算出的火车票是0,这可能意味着那天的航班没有安排,但我搞不清楚的是,如何在模型中安排两个日期??我无法创建2个系列,因为日期也在重复,所以我们会在火车票价中损失很多值

有什么建议吗??如果您需要更详细的说明,请随时发表评论


Tags: 文件数据l1numberdatedtnanamp