深度学习,记忆输入数据而不是学习

2024-09-30 05:22:01 发布

您现在位置:Python中文网/ 问答频道 /正文

我有1000个土耳其语的数据句,比如“a esitir b arti c”。 例句的意思是“a=b+c”。我基本上想把数学土耳其语句子翻译成数学方程式

例如,我有6个句子的数据

  • 句子(“a esitir b arti c”)的意思是“a=b+c”
  • 句子(“b esitir a arti d”)的意思是“b=a+d”
  • 句子(“a esitir c arti d”)的意思是“a=c+d”
  • 句子(“c esitir b arti b”)的意思是“c=b+b”
  • 句子(“d esitir b eksi c”)的意思是“d=b-c”
  • 句意为“d=a+c”

当我根据上面的数据训练我的神经网络后,当我想要“desitir a arti b”的结果时,它并没有给出它应该给出的“d=a+b”。 所以它更像是记忆。

我的人脉不大。为了使它不能记忆,我强迫它变小。然而,这并没有解决我的问题

我的网络(seq2seq RNN-LSTM Encoder-Decoder-type)在有2 3或4个变量的方程上运行得足够好(如a=a,a=a+b,a=a+b+c)。我上面告诉你的只是我问题的一个小例子。

如果重要的话,我使用Adam学习者和CNTK图书馆

你建议我怎么做才能得到正确的结果


Tags: 数据记忆网络数学神经网络句子lstm方程式

热门问题