阈值函数没有为任何变量提供梯度b

# Input and Expected Output of the neural networks xs = tf.placeholder("float32", [None, n_features], name='XtoNN') ys = tf.placeholder("float32", [None, 1], name='YfromNN') # Hidden Layer weightsH = tf.Variable(tf.truncated_normal([n_features, neurons_in_hlayer], mean=0, stddev=1 / np.sqrt(n_features)), name='weights1') biasesH = tf.Variable(tf.truncated_normal([neurons_in_hlayer],mean=0, stddev=1 / np.sqrt(n_features)), name='biases1') yValH = tf.nn.sigmoid(tf.add(tf.matmul(xs, weightsH),biasesH), name='activationLayer1') # Output Layer WeightsO = tf.Variable(tf.truncated_normal([neurons_in_hlayer, n_classes], mean=0, stddev = 1/np.sqrt(n_features)), name='weightsOut') biasesO = tf.Variable(tf.truncated_normal([n_classes], mean=0, stddev=1 / np.sqrt(n_features)), name='biasesOut') yPred = tf.cast(tf.add(tf.matmul(yValH, WeightsO), biasesO), tf.float32) # Cost function redYPred = tf.div(tf.subtract(yPred, tf.reduce_min(yPred)), tf.subtract(tf.reduce_max(yPred), tf.reduce_min(yPred))) binaryYPred = tf.cast(tf.to_int32(redYPred > tf.reduce_mean(redYPred)), tf.float32) cost = tf.reduce_mean(tf.square(binaryYPred-ys, name='Cost')) # Optimizer train = tf.train.GradientDescentOptimizer(learning_rate).minimize(cost)

startTime = datetime.now() # Session with tf.Session() as sess: sess.run(tf.global_variables_initializer()) # sess.run(tf.local_variables_initializer()) saver = tf.train.Saver() for i in range(training_epochs): for j in range(n_samples): # Run NN sess.run([cost, train], feed_dict={xs: X_train[j, :].reshape(1, n_features), ys: Y_train[j].reshape(1,n_classes)}) currentEpochCost = sess.run(cost, feed_dict={xs: X_train, ys: Y_train}) print('Epoch ', (i+1), ': Cost = ', currentEpochCost) timeTaken = datetime.now() - startTime print('Time Taken: ', timeTaken) yTestPredict = sess.run(binaryYPred, feed_dict={xs: X_test})

1条回答

网友
1楼 · 发布于 2024-09-21 03:23:42

发生这种情况是因为在计算中添加了固有的不可微操作（硬阈值）。因为阈值没有梯度，所以没有梯度可以通过网络反向支撑
是否有特定原因使您无法使用softmax将输出分配给两个输出类之一？从某种意义上说，它正在做您试图实现的事情
一旦您对网络进行了培训，并且它输出了两个类的97%，3%，那么在测试/使用时对输出进行二值化就足够简单了

相关问题更多 >

编程相关推荐

热门问题

热门文章