将时间序列数据集转换为有监督学习数据集

2024-09-19 23:27:03 发布

您现在位置:Python中文网/ 问答频道 /正文

我有一个数据集,包含多个项目(例如用户)的时间序列(每天)。 数据简化如下: https://i.ibb.co/Pj4TnHW/trans-original.jpg(我无法发布图片,因为缺少代表点,抱歉)

对于每个用户,此数据集具有所有相同的属性(例如度量)。这些措施每天都在一个时间窗口内采取。每个用户都有自己的“事件日期”。你知道吗

我的目标是将这个时间序列(面向行)数据集转换成一个数据集,用于监督学习。 我想要的布局如下所示: https://i.ibb.co/8DxYpCy/Unbenannt.jpg

目前,我将我的解决方案应用于一个具有约60个度量值的数据集。 到目前为止,我通过在“userid”上使用迭代并应用多个步骤来实现这一点熊猫.融化(), 1.转置()功能。 但这需要大量的预格式化,而且随着数据集的增大,速度会变慢。你知道吗

有没有更好的方法来实现我的转变?我读到了https://machinelearningmastery.com/convert-time-series-supervised-learning-problem-python/但这似乎是另一种类型的问题。。。你知道吗

//编辑#1:根据请求,我创建了尽可能小的notebook/python脚本,用一个简化的数据集来演示我在做什么:https://www.file-upload.net/download-13590592/timeseries_to_supervised.zip.html (Jupyter笔记本,导出的HTML版本,示例输入数据集)


Tags: 数据项目用户httpstrans度量时间图片
1条回答
网友
1楼 · 发布于 2024-09-19 23:27:03

我曾经用R做过类似的事情,它是一种设计得很好的用来处理行的语言(函数式编程)。你可以使用库datatable,它非常快。如果我可以问你想预测哪个专栏?注意不要根据现在或将来的数据预测结果,你只能使用过去:)

相关问题 更多 >