下载MNIST数据集时出现“HTTP错误403:禁止”错误

Downloading http://yann.lecun.com/exdb/mnist/train-images-idx3-ubyte.gz to ./MNIST\raw\train-images-idx3-ubyte.gz HTTP Error 403: Forbidden Stack trace: > File "C:\Program Files (x86)\Microsoft Visual Studio\Shared\Python36_64\Lib\urllib\request.py", line 650, in http_error_default > raise HTTPError(req.full_url, code, msg, hdrs, fp)

3条回答

网友

1楼 · 编辑于 2024-09-25 08:40:46

似乎您可能必须向urllib请求添加一个标题（由于该站点正在迁移到Cloudflare保护）

例如

opener = urllib.request.URLopener()
opener.addheader('User-Agent', some_user_agent)
opener.retrieve(
    url, fpath,
    reporthook=gen_bar_updater()
)

pytorchhere的github论坛也提到了这个问题，并提供了一些解决方案

给出的一个更完整的Python3解决方案如下：

from torchvision import datasets
import torchvision.transforms as transforms
import urllib

num_workers = 0
batch_size = 20
basepath = 'some/base/path'
transform = transforms.ToTensor()

def set_header_for(url, filename):
    opener = urllib.request.URLopener()
    opener.addheader('User-Agent', 'Mozilla/5.0 (Macintosh; Intel Mac OS X 10_9_3) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/35.0.1916.47 Safari/537.36')
    opener.retrieve(
    url, f'{basepath}/{filename}')

set_header_for('http://yann.lecun.com/exdb/mnist/train-images-idx3-ubyte.gz', 'train-images-idx3-ubyte.gz')
set_header_for('http://yann.lecun.com/exdb/mnist/train-labels-idx1-ubyte.gz', 'train-labels-idx1-ubyte.gz')
set_header_for('http://yann.lecun.com/exdb/mnist/t10k-images-idx3-ubyte.gz', 't10k-images-idx3-ubyte.gz')
set_header_for('http://yann.lecun.com/exdb/mnist/t10k-labels-idx1-ubyte.gz', 't10k-labels-idx1-ubyte.gz')
train_data = datasets.MNIST(root='data', train=True,
                                   download=True, transform=transform)
test_data = datasets.MNIST(root='data', train=False,
                                  download=False, transform=transform)

它们使用函数为每个检索添加标题，从而简化了过程

网友

2楼 · 编辑于 2024-09-25 08:40:46

我查了一下，问题是该文件夹已移动到CloudFlare保护下，正如一位评论员在这里提到的：https://github.com/pytorch/vision/issues/1938

还解释了如何通过在其中添加标题来解决/修复此问题。我希望有帮助

网友

3楼 · 编辑于 2024-09-25 08:40:46

使用here中提到的建议，将此添加到我的脚本顶部是有效的：

from six.moves import urllib    
opener = urllib.request.build_opener()
opener.addheaders = [('User-agent', 'Mozilla/5.0')]
urllib.request.install_opener(opener)

相关问题更多 >

编程相关推荐

热门问题

热门文章