如何在两个长度不等的tf.dataset上进行成对迭代？

datasetA = tf.data.Dataset.from_tensor_slices([1, 2, 3, 4, 5, 6]) datasetB = tf.data.Dataset.from_tensor_slices([11, 22, 33, 44]) iterB = iter(datasetB) epochs = 5 for epoch in range(epochs): print(f"Epoch {epoch}") for element in datasetA: print(element) elementB = iterB.get_next() print(elementB)

for epoch in range(epochs): print(f"Epoch {epoch}") for element in datasetA: print(element) elementB = iterB.get_next_as_optional() if not elementB.has_value(): iterB = iter(datasetB) elementB = iterB.get_next_as_optional() print(elementB.get_value())

2条回答

网友

1楼 · 编辑于 2024-10-04 03:22:10

我不知道这种编码语言，但这里是你应该做的

datasetA = tf.data.Dataset.from_tensor_slices([1,  2,  3,  4,  5, 6]);
datasetB = tf.data.Dataset.from_tensor_slices([11, 22, 33, 44]);
set i=0,j=0;
get lengths of both alength and blength;
for(i=0;i<alength;i++){
 print(datasetA[i]);
 print(datasetB[j]);
 if(j<blength-1)
   j++;
 else
  j=0;  
 }

网友

2楼 · 编辑于 2024-10-04 03:22:10

要从两个数据集中获取所有可能的样本对，可以使用以下generator：

    # assuming that dataset_A and dataset_B are defined globally
    def generator():
        for sample_A in dataset_A:
            for sample_B in dataset_B:
                yield (sample_A, sample_B)

要仅获取位于数据集中相同位置（相同索引）的样本对，有一种标准的zip方法：

    dataset = tf.data.Dataset.zip(dataset_A, dataset_B)

当其中一个数据集耗尽时，该生成器停止

如果目标是为来自dataset_A的所有样本获取成对样本，但dataset_B较小，则可以无限重复第二个数据集

     dataset_B = dataset_B.repeat()

然后zip这两个数据集

相关问题更多 >

编程相关推荐

热门问题

热门文章