擅长:python、mysql、java
<p>最初的问题是关于如何下载数据集的子集</p>
<p>因此,建议使用像<code>split='train[:5%]'</code>这样的参数作为只下载5%训练数据的方式的答案是错误的。看起来它仍然下载整个数据集,但只加载5%</p>
<p>您可以通过运行
<code>mnist_ds_5p = tfds.load("mnist", split="train[:5%]")</code>
然后是<code>mnist_ds = tfds.load("mnist", split="train")</code></p>
<p>运行第二个命令后不会进行下载。这是因为在运行第一个命令之后,整个数据集已经被下载和缓存</p>
<p>由于许多数据集都是从压缩表单中获取的,我怀疑有没有一种简单的方法可以避免下载整个数据集</p>