如何构造Kerras-lstm输入向量一个基于热编码字符的inpu文本生成模型

2024-06-26 13:55:57 发布

您现在位置:Python中文网/ 问答频道 /正文

我试图训练一个keraslstm模型来生成potry,我将数据编码为字符序列,其中每个字符都是一个热编码的。我使用多对一模型,所以我的输入是一个像这样的二维数组。 [[0,1,0], [1,0,0], ... ,[1,0,0]]其中每个向量表示一个时间步,我想让512个字符fead到每个lstm单元,让最后一个预测同一个热编码向量,并预测下一个字符。你知道吗

如何将数据拆分为批处理和时间步?你知道吗

谢谢

data_gen = TimeseriesGenerator(data, targets,
                               length=n_timesteps,
                               batch_size=n_batches)
model.fit_generator(data_gen ,epochs=100, shuffle=False, callbacks=callbacks_list)

Tags: 模型编码data时间序列数组字符向量
1条回答
网友
1楼 · 发布于 2024-06-26 13:55:57

似乎你需要一个滑动窗口来覆盖输入。在预测下一个角色之前,你看了多少个角色?为此,utils中有TimeseriesGenerator,可以将2d数据转换为3d窗口输入,用于训练。它将为您生成该字符序列的输入和目标。对于更手动的方法,字符生成是repo中的Keras example。你知道吗

相关问题 更多 >