为什么每次调用SplitWithPercentration时都会更改每套中的金额？

from pybrain.datasets import SequentialDataSet def create_data_sets(rows): ds = SequentialDataSet(13, 1) last_id = -1 count = 0 for row in rows: current_id = int(row[14]) if current_id != last_id: count += 1 ds.newSequence() last_id = current_id ds.appendLinked( [int(row[0]) / 10000.0, int(row[1]) / 10000.0, int(row[2]) / 20.0, int(row[3]) / 9.0, int(row[4]) / 9.0, int(row[5]) / 6.0, int(row[6]) / 6.0, float(row[7]), float(row[8]), float(row[9]), float(row[10]), int(row[11]) / 6.0, int(row[12]) / 6.0], [float(row[13])]) test_data, train_data = ds.splitWithProportion(0.25) return (test_data, train_data, count)

from pybrain import datasets d = datasets.SequentialDataSet(0, 1) d.addSample([],[0]) d.addSample([],[1]) d.addSample([],[0]) d.addSample([],[1]) d.addSample([],[0]) d.addSample([],[1]) d.newSequence() d.addSample([],[0]) d.addSample([],[1]) d.addSample([],[0]) d.addSample([],[1]) d.addSample([],[0]) d.addSample([],[1]) d.newSequence() d.addSample([],[0]) d.addSample([],[0]) d.addSample([],[1]) d.addSample([],[0]) d.addSample([],[1]) d.newSequence() d.addSample([],[0]) d.addSample([],[1]) d.addSample([],[0]) d.addSample([],[1]) d.addSample([],[0]) d.addSample([],[1]) for _ in range(2): test, train = d.splitWithProportion(0.25) print str(len(test)) + " " + str(len(train))

1条回答

网友

1楼 · 发布于 2024-10-02 18:14:51

我相信你的问题与你如何创造新的序列有关

        if current_id != last_id:
        count += 1
        ds.newSequence()

我已经验证了以下每次调用都返回一致的结果“618”。在

^{pr2}$

编辑：使用SequentialDataSet需要记住的是，拆分是沿着序列进行的，而不是单个样本。因此，对于4个序列，0.25的拆分将给出1个测试序列和3个训练序列。如果序列的长度不一样，那么您将得到不同的len（）测试和训练结果。对于顺序数据集，一切都按预期工作。在

相关问题更多 >

编程相关推荐

热门问题

热门文章