我有一个数据集,其中有两个日期列。有点像下面的桌子。火车票价;票价在不同的文件中&;有不同的日期
flt_number carrier flt_date flt_book_dt train_fare/pred_fare
123 L1 2018-01-01 2017-11-01 2015/NaN
123 L1 2018-01-01 2017-11-02 562/NaN
123 L1 2018-01-01 2017-11-03 562/NaN
...
123 L1 2018-01-01 2018-01-01 2015/NaN
123 L1 2018-02-01 2018-12-17 562/NaN
123 L1 2018-02-01 2018-12-18 562/NaN
...
123 L1 2018-04-01 2018-04-01 5055/NaN
123 L1 2018-05-01 2018-04-02 890/NaN
111 L2 2018-01-01 2017-11-15 1000/NaN
...
现在,即使我按flt\u date或flt\u book\u dt这两个日期对数据帧进行排序,也会丢失一些日期,但这两个日期都在移动&;有时也会重复,我们需要预测的是,在某个特定的飞行手册上,飞行日期的机票价格是多少
111 L2 2019-05-01 2019-03-10 ??
到目前为止,我所做的是,我计算了两列中所有缺失的日期;估算出的火车票是0,这可能意味着那天的航班没有安排,但我搞不清楚的是,如何在模型中安排两个日期??我无法创建2个系列,因为日期也在重复,所以我们会在火车票价中损失很多值
有什么建议吗??如果您需要更详细的说明,请随时发表评论
目前没有回答
相关问题 更多 >
编程相关推荐