2024-06-25 06:13:03 发布
网友
几天来,我一直在尝试使用LSTM来构建一个简单的正弦波序列生成,目前还没有任何成功的迹象。在
我从time sequence prediction example开始
我想做的不同的是:
这是指向my code的链接。“实验.py“是主文件
我要做的是:
结果是:
我根本不明白问题出在哪里。我已经玩了一个星期了,没有任何进展。 我将非常感谢你的帮助。在
谢谢你
这是正常的行为,发生这种情况是因为你的网络对输入的质量过于自信,没有学会充分依赖过去(依赖于它的内部状态),只依赖于输入。当您在生成设置中将网络应用于其自身的输出时,网络的输入不如在获得真实输入的培训或验证案例中那样可靠。在
我有两个可能的解决方案:
第一种是最简单但不太直观的方法:在输入中添加一点高斯噪声。这将迫使网络更加依赖其隐藏状态。
第二种是最明显的解决方案:在训练过程中,以一定概率p给它输入而不是真实的输入,而是它产生的输出。从p=0开始训练,逐渐增加它,使它学会独立地综合越来越长的序列。这称为计划抽样,您可以在这里阅读更多关于它的内容:https://arxiv.org/abs/1506.03099。
这是正常的行为,发生这种情况是因为你的网络对输入的质量过于自信,没有学会充分依赖过去(依赖于它的内部状态),只依赖于输入。当您在生成设置中将网络应用于其自身的输出时,网络的输入不如在获得真实输入的培训或验证案例中那样可靠。在
我有两个可能的解决方案:
第一种是最简单但不太直观的方法:在输入中添加一点高斯噪声。这将迫使网络更加依赖其隐藏状态。
第二种是最明显的解决方案:在训练过程中,以一定概率p给它输入而不是真实的输入,而是它产生的输出。从p=0开始训练,逐渐增加它,使它学会独立地综合越来越长的序列。这称为计划抽样,您可以在这里阅读更多关于它的内容:https://arxiv.org/abs/1506.03099。
相关问题 更多 >
编程相关推荐