使用Keras将时间序列数据输入NN

def generator(data, lookback, delay, min_index, max_index, shuffle=False, batch_size=128, step=6): if max_index is None: max_index = len(data) - delay - 1 i = min_index + lookback while 1: if shuffle: rows = np.random.randint( min_index + lookback, max_index, size=batch_size) else: if i + batch_size >= max_index: i = min_index + lookback rows = np.arange(i, min(i + batch_size, max_index)) i += len(rows) samples = np.zeros((len(rows), lookback // step, data.shape[-1])) targets = np.zeros((len(rows),)) for j, row in enumerate(rows): indices = range(rows[j] - lookback, rows[j], step) samples[j] = data[indices] targets[j] = data[rows[j] + delay][1] yield samples, targets lookback = 1440 # Basically, going back 10 days step = 6 # Taking an hourly sample delay = 144 # Want to forecast temperature for the next 24 hours batch_size = 128 train_gen = generator(float_data, lookback=lookback, delay=delay, min_index=0, max_index=200000, shuffle=True, step=step, batch_size=batch_size) val_gen = generator(float_data, lookback=lookback, delay=delay, min_index=200001, max_index=300000, step=step, batch_size=batch_size)

from keras.models import Sequential from keras import layers from keras.optimizers import RMSprop model = Sequential() model.add(layers.Flatten(input_shape=(lookback // step, float_data.shape[-1]))) model.add(layers.Dense(32, activation='relu')) model.add(layers.Dense(1)) model.compile(optimizer=RMSprop(), loss='mae') history = model.fit_generator(train_gen, steps_per_epoch=500, epochs=20, validation_data=val_gen, validation_steps=val_steps)

2条回答

网友

1楼 · 编辑于 2024-05-20 05:28:04

数据的索引从0开始：因为序列长度是240:

len([0-239]) = 240

当你想训练的时候shuffle被设置为True，当你想要评估的时候你把它设置为False

网友

2楼 · 编辑于 2024-05-20 05:28:04

我想这是Francois Chollet的《深度学习Python》中的一个例子。 Look back是从中生成样本中的观测值的数量。在

步骤将定义观察顺序：

观察指标如下：

X   [i, i+step, i+(2*Step), i+(3*step),...  .. ,(i+look_back/step)] 
y  - [(i+look_back/step)+delay]

批处理数量=此类观察的数量

例如：输入数据

^{pr2}$

对于以下参数：

lookback = 6 step = 2 delay = 2 batch_size = 3

输出为：

 array([[[996.57,  -8.41, 265.01],
     [996.51,  -8.31, 265.12],
     [996.5 ,  -8.05, 265.38]],

    [[996.53,  -8.51, 264.91],
     [996.51,  -8.27, 265.15],
     [996.5 ,  -7.62, 265.81]],

    [[996.51,  -8.31, 265.12],
     [996.5 ,  -8.05, 265.38],
     [996.5 ,  -7.62, 265.81]]]), array([-8.43, -8.76, -8.88])]

设置shuffle=True并不重要，因为观察总是从索引回溯到特定索引。在

过去10天的每小时读数用于预测24小时后的温度。因此，以这种格式生成数据[[0-240]，[241-479]，………]将不能提供预测（24小时+10分钟）温度的观测值

相关问题更多 >

编程相关推荐

热门问题

热门文章