有没有一种方法可以训练大脑在一个神经网络中识别多种模式?例如,我添加了两种不同模式的几种排列:
第一种模式:
(200[1-9], 200[1-9]),(400[1-9],400[1-9])
第二种模式:
^{pr2}$然后对于我的无监督数据集,我添加了(9000290009),我希望它会返回[100[1-9],100[1-9]](第二种模式),但是它返回[2508425084]。我意识到它试图在给定所有输入的情况下找到最佳值,但是我试图让它在集合中区分某些模式,如果这有意义的话。在
这是我的例子:
Request for example: Recurrent neural network for predicting next value in a sequence
from pybrain.tools.shortcuts import buildNetwork
from pybrain.supervised.trainers import BackpropTrainer
from pybrain.datasets import SupervisedDataSet,UnsupervisedDataSet
from pybrain.structure import LinearLayer
from pybrain.datasets import ClassificationDataSet
from pybrain.structure.modules.sigmoidlayer import SigmoidLayer
import random
ds = ClassificationDataSet(2, 1)
tng_dataset_size = 1000
unseen_dataset_size = 100
print 'training dataset size is ', tng_dataset_size
print 'unseen dataset size is ', unseen_dataset_size
print 'adding data..'
for x in range(tng_dataset_size):
rand1 = random.randint(1,9)
rand2 = random.randint(1,9)
pattern_one_0 = int('2000'+str(rand1))
pattern_one_1 = int('2000'+str(rand2))
pattern_two_0 = int('9000'+str(rand1))
pattern_two_1 = int('9000'+str(rand2))
ds.addSample((pattern_one_0,pattern_one_1),(0))#pattern 1, maps to 0
ds.addSample((pattern_two_0,pattern_two_1),(1))#pattern 2, maps to 1
unsupervised_results = []
net = buildNetwork(2, 1, 1, outclass=LinearLayer,bias=True, recurrent=True)
print 'training ...'
trainer = BackpropTrainer(net, ds)
trainer.trainEpochs(500)
ts = UnsupervisedDataSet(2,)
print 'adding pattern 2 to unseen data'
for x in xrange(unseen_dataset_size):
pattern_two_0 = int('9000'+str(rand1))
pattern_two_1 = int('9000'+str(rand1))
ts.addSample((pattern_two_0, pattern_two_1))#adding first part of pattern 2 to unseen data
a = [int(i) for i in net.activateOnDataset(ts)[0]]#should map to 1
unsupervised_results.append(a[0])
print 'total hits for pattern 1 ', unsupervised_results.count(0)
print 'total hits for pattern 2 ', unsupervised_results.count(1)
[[EDIT]]添加了分类变量和分类数据集。在
[[EDIT 1]]增加了更大的训练集和不可见集
是的,有。这里的问题是你选择的表示法。你在训练网络输出实数,所以你的神经网络是一个函数,在一定程度上近似于你在数据集中采样和提供的函数。因此得出的结果值介于10000到40000之间。在
它看起来更像是你在找一个classifier。 根据你的描述,我假设你有一套明确定义的模式,你正在寻找。然后必须将模式映射到一个范畴变量。例如,您提到的模式1是0,模式2是1,依此类推。在
然后,训练网络输出输入模式所属的类(0,1,…)。 可以说,考虑到模式的结构,基于规则的分类可能比ann更合适。在
关于数据量,你需要更多的数据。最基本的方法是将数据集分成两组(例如70-30)。您使用70%的样本进行培训,剩下的30%用作不可见的数据(测试数据),以评估模型的泛化/过度拟合。一旦基本操作完成,您可能需要阅读有关交叉验证的内容。在
相关问题 更多 >
编程相关推荐