神经网络偏差训练

def adjustWeights(self, err): self.__weights = self.__weights - (err * self.__epsilon + self.__lambda * self.__weights) def adjustBiases(self, err): a = np.sum(np.multiply(err, self.localPartialGrad), axis=1) * self.__epsilon a.shape = (err.shape[0], 1) self.__biases = self.__biases - a

dloss/dW1 = -(YHat-X2)*relu'(X1W1 + b1)X1 dloss/dW0 = -(YHat-X2)*relu'(X1W1 + b1)W1*relu'(X0W0 + b0)X0 dloss/db1 = -(YHat-X2)*relu'(X1W1 + b1) dloss/db0 = -(YHat-X2)*relu'(X1W1 + b1)W1*relu'(X0W0 + b0)

===========================NeuralNetwork=========================== Layers: ===============Layer 0 :=============== Weights: (1, 3) [[0.05539559 0.05539442 0.05539159]] Biases: (4, 1) [[0. ] [0.22897166] [0.56300199] [1.30167665]] ==============\Layer 0 :=============== ===============Layer 1 :=============== Weights: (3, 1) [[0.29443245] [0.29442639] [0.29440642]] Biases: (4, 1) [[0. ] [0.13199981] [0.32762199] [1.10023446]] ==============\Layer 1 :=============== ==========================\NeuralNetwork===========================

===========================NeuralNetwork=========================== Layers: ===============Layer 0 :=============== Weights: (1, 1) [[0.47149317]] Biases: (4, 1) [[0. ] [0.18813419] [0.48377987] [1.33644038]] ==============\Layer 0 :=============== ==========================\NeuralNetwork===========================

1条回答

网友

1楼 · 发布于 2024-10-02 22:29:20

_{移动了OP问题的答案}

结果我从来没有正确处理过我的训练数据。输入向量：

[[0.0], [1.0], [2.0], [3.0]]

归一化后，我将这个向量除以输入的最大值3，得到

^{pr2}$

对于输入的Y训练向量

[[0.0], [2.0], [4.0], [6.0]]

我愚蠢地决定对这个向量做同样的处理，但是最大值是y6：

^{4}$

所以基本上我是说“嘿，网络，模仿我的输入”。这是我的第一个错误。第二个错误是由于对缩放比例的更多误解。在

虽然1是0.333，0.333*2=0.666，然后乘以y（6）6*0.666=2的最大值，如果我用另一组数据再试一次，请说：

[[2.0], [3.0], [4.0], [5.0]]

2等于2/5=0.4，0.4*2=0.8，乘以5就是2，然而在现实世界中，我们无法知道5是数据集的最大输出，因此我想它可能是Y训练的最大值，也就是6，所以不是2/5=0.4，0.4*2=0.8*5，我做了2/5=0.4，0.4*2=0.8*6=4.8。在

所以我得到了一些奇怪的偏差和权重的行为。所以在基本上摆脱了标准化之后，我可以自由地调整超参数，现在作为基础训练数据的输出：

输入：

X:
 [[0.]
 [1.]
 [2.]
 [3.]]

我得到这个输出：

shape:  (4, 1) 
 [[0.30926124]
 [2.1030826 ]
 [3.89690395]
 [5.6907253 ]]

对于额外的测试数据（未经培训）：

shape:  (4, 1) 
 [[2.]
 [3.]
 [4.]
 [5.]]

我得到这个输出：

shape:  (4, 1) 
 [[3.89690395]
 [5.6907253 ]
 [7.48454666]
 [9.27836801]]

所以现在我很高兴。我还把我的激活改为漏泄relu，因为它应该更适合线性方程（我认为）。我相信有更多的测试数据和更多的超参数调整，这将是一个完美的配合。谢谢大家的帮助。试着解释我的问题真的能让事情有一个正确的角度。在

相关问题更多 >

编程相关推荐

热门问题

热门文章