与海底采样器相关

import numpy as np import torch from torchvision import transforms from torch.utils.data.sampler import SubsetRandomSampler train_transforms = transforms.Compose([transforms.ToTensor(), transforms.Normalize([0.485, 0.456, 0.406], [0.229, 0.224, 0.225])]) dataset = datasets.ImageFolder( '/data/images/train', transform=train_transforms ) validation_split = .2 shuffle_dataset = True random_seed= 42 batch_size = 20 dataset_size = len(dataset) #4996 indices = list(range(dataset_size)) split = int(np.floor(validation_split * dataset_size)) if shuffle_dataset : np.random.seed(random_seed) np.random.shuffle(indices) train_indices, val_indices = indices[split:], indices[:split] train_sampler = SubsetRandomSampler(train_indices) valid_sampler = SubsetRandomSampler(val_indices) train_loader = torch.utils.data.DataLoader(dataset, batch_size=batch_size, sampler=train_sampler) validation_loader = torch.utils.data.DataLoader(dataset, batch_size=batch_size, sampler=valid_sampler)

1条回答

网友

1楼 · 发布于 2024-09-30 16:23:56

你是说培训和验证而不是测试和验证

如果是，则SubsetRandomSampler使用从索引中随机选择的样本。因此，您可以在将每个类的索引放入train_indices和val_indices之前随机拆分它们

像

indexs = [[] for _ in range(len(dataset.classes))]  # you can't use `[[]] * len(dataset.classes)`. Although there might be better ways but I don't know
for idx, (_, class_idx) in enumerate(dataset):
    indexs[class_idx].append(idx)
train_indices, val_indices = [], []
for cl_idx in indexs:
    size = len(cl_idx)
    split = int(np.floor(validation_split * size))
    np.random.shuffle(cl_idx)
    train_indices.extend(cl_idx[split:])
    val_indices.extend(cl_idx[:split])
train_sampler = SubsetRandomSampler(train_indices)
valid_sampler = SubsetRandomSampler(val_indices)

相关问题更多 >

编程相关推荐

热门问题

热门文章