GPU-OOM：具有不同模型的超参数调谐回路

import itertools import tensorflow as tf from tensorflow import keras from keras.losses import sparse_categorical_crossentropy from keras.preprocessing.image import ImageDataGenerator from keras.optimizers import Adam hyperparameters = { 'lr': [1e-3, 1e-4], 'model': [model1, model2] } hps, values = zip(*hyperparameters.items()) for v in itertools.product(*values): cur_hps = dict(zip(hps, v)) model = cur_hps['model'](input_shape = (256, 256, 3)) optim = Adam(lr = cur_hps['lr']) model.compile(optimizer = optim, loss = categorical_categorical_crossentropy, metrics = ['accuracy']) train_gen = myDataGenerator() # returns Sequence model.fit_generator(train_gen, epochs = 5, use_multiprocessing = True, workers = 8)

1条回答

网友

1楼 · 发布于 2024-09-25 04:19:43

似乎有两种可能的原因：

前一个网络训练后内存不释放
给定的模型实在太大了

对于第一种情况，请选中Keras: release memory after finish training process

对于第二种情况，尝试减少数据生成器中的batch_size，看看它是否解决了问题。或者，使用多个GPU或更改体系结构，使其可以放入内存。你知道吗

相关问题更多 >

编程相关推荐

热门问题

热门文章