时间序列的分类如何使用来自多个位置的数据来训练一个模型?

2024-10-01 15:38:41 发布

您现在位置:Python中文网/ 问答频道 /正文

我有来自多个地点的天气传感器的数据源。我试图对某个事件是否正在发生进行分类(简单的二进制分类)。 我已标记数据(1 mil)。每个位置的样本(间隔15分钟)

我假设我尝试分类的事件非常简单(许多模式在所有位置以相同的方式出现)

我想为所有地点制作一个模型,但也能够概括下一个将要添加的地点

现在我使用的是简单的BiLSTM网络,数据通过如下滚动窗口进行预处理:

    def create_dataset(self, dataset, look_back=1):
     dataX, dataY = [], []
     for i in range(len(dataset) - look_back - 1):
         a = dataset[i:(i + look_back), :]
         dataX.append(a)
         dataY.append(dataset[i + look_back, 0])
     return np.array(dataX), np.array(dataY)

我的第一个想法是使用滚动窗口预处理每个位置,将所有数据连接到一个训练集中,并在每个历元之前洗牌

你认为这是一个好方法吗?你能推荐一个更好的吗?我错过什么了吗

提前谢谢

编辑:我不想在训练期间告诉我的模型确切的位置,因为将来当我想在一个新的位置预测事件时,当前的训练会偏向某个位置


Tags: 数据模型npback事件分类传感器array
1条回答
网友
1楼 · 发布于 2024-10-01 15:38:41

我假设您希望您的模型知道您从哪个位置提供输入。因此,您的输入必须以某种方式告诉您发送数据的位置。您可以将数据的位置部分连接到实际的天气信息,或者使用一个以上的热编码,如x=temperature*e_(loc),其中e_(loc)=(0,0,1,0,...)用于第三个位置。在后一种设置中,您还可以同时向系统提供多个温度(或其他信息)

相关问题 更多 >

    热门问题