擅长:python、mysql、java
<p>要从两个数据集中获取所有可能的样本对,可以使用以下<code>generator</code>:</p>
<pre><code> # assuming that dataset_A and dataset_B are defined globally
def generator():
for sample_A in dataset_A:
for sample_B in dataset_B:
yield (sample_A, sample_B)
</code></pre>
<p>要仅获取位于数据集中相同位置(相同索引)的样本对,有一种标准的<code>zip</code>方法:</p>
<pre><code> dataset = tf.data.Dataset.zip(dataset_A, dataset_B)
</code></pre>
<p>当其中一个数据集耗尽时,该生成器停止</p>
<p>如果目标是为来自<code>dataset_A</code>的所有样本获取成对样本,但<code>dataset_B</code>较小,则可以无限重复第二个数据集</p>
<pre><code> dataset_B = dataset_B.repeat()
</code></pre>
<p>然后<code>zip</code>这两个数据集</p>