你如何使用tf.数据允许数据集选择和批处理的管道？

TrainData = tf.data.Dataset.from_generator(TrainGenerator,tf.float32) TestData = tf.data.Dataset.from_generator(TestGenerator,tf.float32) DataIterator = tf.data.Iterator.from_structure(tf.float32) DataNext = DataIterator.get_next() InitTrain = DataIterator.make_initializer(TrainData) InitTest = DataIterator.make_initializer(TestData)

1条回答

网友

1楼 · 发布于 2024-05-19 02:50:55

每个数据集独立于其他数据集运行，迭代器根据您使用的初始值设定项在detest之间切换。因此，如果要批处理一个数据集而不是另一个数据集，则应使用：

TrainData = tf.data.Dataset.from_generator(TrainGenerator,tf.float32)
TrainData = TrainData.batch(100)

TestData = tf.data.Dataset.from_generator(TestGenerator,tf.float32)

DataIterator = tf.data.Iterator.from_structure(tf.float32)
DataNext = DataIterator.get_next()
InitTrain = DataIterator.make_initializer(TrainData)
InitTest = DataIterator.make_initializer(TestData)

顺便说一句，您还可以使用这两条管道不同于（如果您想）为每个数据集执行不同的映射。例如，您可以对列车数据使用批处理规范化，但对测试数据不进行规范化（如果您已经在整个数据集中进行了标准化）。在

相关问题更多 >

编程相关推荐

热门问题

热门文章