基本的神经网络，权重太高

import numpy as np from scipy.special import expit as ex rand.seed(10) training_set=[[0,1,0],[1,0,1],[0,0,0],[1,1,1]] #The training sets and their outputs training_outputs=[0,1,0,1] weightlst=[rand.uniform(-1,1),rand.uniform(-1,1),rand.uniform(-1,1)] #Weights are randomly set with a value between -1 and 1 print('Random weights\n'+str(weightlst)) def calcout(inputs,weights): #Calculate the expected output with given inputs and weights output=0.5 for i in range(len(inputs)): output=output+(inputs[i]*weights[i]) #print('\nmy output is ' + str(ex(output))) return ex(output) #Return the output on a sigmoid curve between 0 and 1 def adj(expected_output,training_output,weights,inputs): #Adjust the weights based on the expected output, true (training) output and the weights adjweights=[] error=expected_output-training_output for i in weights: adjweights.append(i+(error*(expected_output*(1-expected_output)))) return adjweights #Train the network, adjusting weights each time training_iterations=10000 for k in range(training_iterations): for l in range(len(training_set)): expected=calcout(training_set[l],weightlst) weightlst=adj(expected,training_outputs[l],weightlst,training_set[l]) new_instance=[1,0,0] #Calculate and return the expected output of a new instance print('Adjusted weights\n'+str(weightlst)) print('\nExpected output of new instance = ' + str(calcout(new_instance,weightlst)))

1条回答

网友

1楼 · 发布于 2024-10-04 03:18:43

错误：

神经元中没有使用偏倚
错误=训练输出-梯度下降的预期输出（而不是相反）
第i个权值的权值更新规则w_i = w_i + learning_rate * delta_w_i，（delta\u w\u i是相对于w\u i的损失梯度）
对于平方损失delta_w_i = error*sample[i]（输入向量样本的第i个值）
由于您只有一个神经元（一个隐藏层或大小1），因此您的模型只能学习线性可分离数据（它只是一个线性分类器）。线性可分数据的例子是由布尔函数AND、OR生成的数据。注意，布尔值XOR不是线性可分的。你知道吗

修复了错误的代码

import numpy as np
from scipy.special import expit as ex

rand.seed(10)
training_set=[[0,1,0],[1,0,1],[0,0,0],[1,1,1]] #The training sets and their outputs
training_outputs=[1,1,0,1] # Boolean OR of input vector
#training_outputs=[0,0,,1] # Boolean AND of input vector

weightlst=[rand.uniform(-1,1),rand.uniform(-1,1),rand.uniform(-1,1)]  #Weights are randomly set with a value between -1 and 1
bias = rand.uniform(-1,1)

print('Random weights\n'+str(weightlst))

def calcout(inputs,weights, bias):    #Calculate the expected output with given inputs and weights
    output=bias
    for i in range(len(inputs)):
        output=output+(inputs[i]*weights[i])
    #print('\nmy output is ' + str(ex(output)))
    return ex(output)                 #Return the output on a sigmoid curve between 0 and 1

def adj(expected_output,training_output,weights,bias,inputs):   #Adjust the weights based on the expected output, true (training) output and the weights
    adjweights=[]
    error=training_output-expected_output
    lr = 0.1
    for j, i in enumerate(weights):
        adjweights.append(i+error*inputs[j]*lr)
    adjbias = bias+error*lr
    return adjweights, adjbias

#Train the network, adjusting weights each time
training_iterations=10000
for k in range(training_iterations):
    for l in range(len(training_set)):
        expected=calcout(training_set[l],weightlst, bias)
        weightlst, bias =adj(expected,training_outputs[l],weightlst,bias,training_set[l])

new_instance=[1,0,0]           #Calculate and return the expected output of a new instance

print('Adjusted weights\n'+str(weightlst))
print('\nExpected output of new instance = ' + str(calcout(new_instance,weightlst, bias)))

输出：

Random weights
[0.142805189379827, -0.14222189064977075, 0.15618260226894076]
Adjusted weights
[6.196759842119063, 11.71208191137411, 6.210137255008176]
Expected output of new instance = 0.6655563851223694

如上图所示，对于输入[1,0,0]，模型预测的概率0.66为1级（因为0.66>；0.5）。它是正确的，因为输出类是或输入向量。你知道吗

注：

为了学习/理解每个权重是如何更新的，可以像上面那样编写代码，但实际上所有操作都是矢量化的。检查link中的矢量化实现。你知道吗

修复了错误的代码

注：

相关问题更多 >

编程相关推荐

热门问题

热门文章