基于Pybrain的模式识别

2024-06-28 20:14:45 发布

您现在位置:Python中文网/ 问答频道 /正文

有没有一种方法可以训练大脑在一个神经网络中识别多种模式?例如,我添加了两种不同模式的几种排列:

第一种模式:

(200[1-9], 200[1-9]),(400[1-9],400[1-9])

第二种模式:

^{pr2}$

然后对于我的无监督数据集,我添加了(9000290009),我希望它会返回[100[1-9],100[1-9]](第二种模式),但是它返回[2508425084]。我意识到它试图在给定所有输入的情况下找到最佳值,但是我试图让它在集合中区分某些模式,如果这有意义的话。在

这是我的例子:

Request for example: Recurrent neural network for predicting next value in a sequence

from pybrain.tools.shortcuts import buildNetwork
from pybrain.supervised.trainers import BackpropTrainer
from pybrain.datasets import SupervisedDataSet,UnsupervisedDataSet
from pybrain.structure import LinearLayer
from pybrain.datasets import ClassificationDataSet
from pybrain.structure.modules.sigmoidlayer import SigmoidLayer
import random

ds = ClassificationDataSet(2, 1)

tng_dataset_size = 1000
unseen_dataset_size = 100
print 'training dataset size is ', tng_dataset_size
print 'unseen dataset size is ', unseen_dataset_size
print 'adding data..'
for x in range(tng_dataset_size):
   rand1 = random.randint(1,9)
   rand2 = random.randint(1,9)

   pattern_one_0 = int('2000'+str(rand1))
   pattern_one_1 = int('2000'+str(rand2))
   pattern_two_0 = int('9000'+str(rand1))
   pattern_two_1 = int('9000'+str(rand2))
   ds.addSample((pattern_one_0,pattern_one_1),(0))#pattern 1, maps to 0
   ds.addSample((pattern_two_0,pattern_two_1),(1))#pattern 2, maps to 1


unsupervised_results = []

net = buildNetwork(2, 1, 1, outclass=LinearLayer,bias=True, recurrent=True)
print 'training ...'
trainer = BackpropTrainer(net, ds)
trainer.trainEpochs(500)


ts = UnsupervisedDataSet(2,)
print 'adding pattern 2 to unseen data'
for x in xrange(unseen_dataset_size):
   pattern_two_0 = int('9000'+str(rand1))
   pattern_two_1 = int('9000'+str(rand1))

   ts.addSample((pattern_two_0, pattern_two_1))#adding first part of pattern 2 to unseen data
   a = [int(i) for i in net.activateOnDataset(ts)[0]]#should map to 1

   unsupervised_results.append(a[0])

print 'total hits for pattern 1 ', unsupervised_results.count(0)
print 'total hits for pattern 2 ', unsupervised_results.count(1)

[[EDIT]]添加了分类变量和分类数据集。在

[[EDIT 1]]增加了更大的训练集和不可见集


Tags: tofromimportforsize模式datasetint
1条回答
网友
1楼 · 发布于 2024-06-28 20:14:45

是的,有。这里的问题是你选择的表示法。你在训练网络输出实数,所以你的神经网络是一个函数,在一定程度上近似于你在数据集中采样和提供的函数。因此得出的结果值介于10000到40000之间。在

它看起来更像是你在找一个classifier。 根据你的描述,我假设你有一套明确定义的模式,你正在寻找。然后必须将模式映射到一个范畴变量。例如,您提到的模式1是0,模式2是1,依此类推。在

然后,训练网络输出输入模式所属的类(0,1,…)。 可以说,考虑到模式的结构,基于规则的分类可能比ann更合适。在

关于数据量,你需要更多的数据。最基本的方法是将数据集分成两组(例如70-30)。您使用70%的样本进行培训,剩下的30%用作不可见的数据(测试数据),以评估模型的泛化/过度拟合。一旦基本操作完成,您可能需要阅读有关交叉验证的内容。在

相关问题 更多 >