Keras自定义生成器比fi慢50倍

2024-05-19 22:11:23 发布

您现在位置:Python中文网/ 问答频道 /正文

我查看了所有的“慢配生成器”帖子并实施了所有的修复,我的自定义生成器仍然比标准配置慢50倍。同样的配置,我们说的是20秒/历元对800秒/历元。你知道吗

如果我设置verbose=1,我还注意到使用自定义生成器时,它会定期“暂停”。如果我使用标准配合,它将以正常的速度通过所有批次。 编辑:我注意到停顿是worker的倍数。如果我设置workers=16,使用\u multiprocessing=True,它将在每第16批中暂停很长时间。有没有办法阻止这种停顿??你知道吗

下面是我的自定义生成器代码的精简版本,如何进一步优化它?你知道吗

class custom_generator(Sequence):

    def __init__(self, <variables passed in here>):

        # Assign self.variables here

    def __len__(self):

        return int(np.floor(len(self.y) / self.batch_size))

    def on_epoch_end(self):

        if self.shuffle == True:
            # do shuffle

    def image_to_np(self, imagePath, seed):

        img = cv2.imread(imagePath)

        # Do random data augmentation
        if self.aug == True:
            new_img = self.image_gen.random_transform(img, seed=seed)
            new_img = self.image_gen.standardize(new_img)
            img = np.expand_dims(new_img, axis=0)
        elif self.aug == False:
            img = np.expand_dims(img, axis=0)
        else:
            raise Exception('Specify augmentation True or False')

        return img, imagePath

    def generate_images(self, i):

        img_seed = random.randint(0,1000)

        # Process frame
        imagePath  = self.X[i]
        imageLabel = self.y[i]
        img, path = self.image_to_np(imagePath, img_seed)

        return img, imageLabel

    def __getitem__(self, i, path=False):

        # Initialize empty np arrays
        data = np.empty((self.batch_size, self.dim[1], self.dim[0], self.n_channels), dtype=float)
        labl = np.empty((self.batch_size), dtype=int)

        k = i * self.batch_size
        for idx in range(self.batch_size):
            # Generate image
            img, label = self.generate_images(k)
            k += 1
            # Store image
            data[idx] = img
            # Store labels
            labl[idx] = label

return data, labl

Tags: imageselffalsetrueimgnewdatasize