为什么tensorflow模块占用所有GPU内存？

x = tf.keras.layers.Input(shape=(256,256,1)) model = Sequential( [ Conv2D(64, 3, activation = 'relu', padding = 'same', kernel_initializer = 'he_normal'), Conv2D(64, 3, activation = 'relu', padding = 'same', kernel_initializer = 'he_normal'), Conv2D(64, 3, activation = 'relu', padding = 'same', kernel_initializer = 'he_normal'), MaxPooling2D(pool_size=(2, 2)), Conv2D(128, 3, activation = 'relu', padding = 'same', kernel_initializer = 'he_normal'), Conv2D(128, 3, activation = 'relu', padding = 'same', kernel_initializer = 'he_normal'), Conv2D(128, 3, activation = 'relu', padding = 'same', kernel_initializer = 'he_normal'), MaxPooling2D(pool_size=(2, 2)), Conv2D(256, 3, activation = 'relu', padding = 'same', kernel_initializer = 'he_normal'), Conv2D(256, 3, activation = 'relu', padding = 'same', kernel_initializer = 'he_normal'), Conv2D(256, 3, activation = 'relu', padding = 'same', kernel_initializer = 'he_normal'), MaxPooling2D(pool_size=(2, 2)), Conv2D(512, 3, activation = 'relu', padding = 'same', kernel_initializer = 'he_normal'), Conv2D(512, 3, activation = 'relu', padding = 'same', kernel_initializer = 'he_normal'), Conv2D(512, 3, activation = 'relu', padding = 'same', kernel_initializer = 'he_normal'), MaxPooling2D(pool_size=(2, 2)), Conv2D(1024, 3, activation = 'relu', padding = 'same', kernel_initializer = 'he_normal'), Conv2D(1024, 3, activation = 'relu', padding = 'same', kernel_initializer = 'he_normal'), Conv2D(1024, 3, activation = 'relu', padding = 'same', kernel_initializer = 'he_normal'), Activation('relu')(Add()([conv5_0, conv5_2])), MaxPooling2D(pool_size=(2, 2)), Conv2D(2048, 3, activation = 'relu', padding = 'same', kernel_initializer = 'he_normal'), Conv2D(2048, 3, activation = 'relu', padding = 'same', kernel_initializer = 'he_normal'), Conv2D(2048, 3, padding = 'same', kernel_initializer = 'he_normal'), UpSampling2D(size = (2,2)), Conv2D(1024, 2, activation = 'relu', padding = 'same', kernel_initializer = 'he_normal'), Conv2D(1024, 3, activation = 'relu', padding = 'same', kernel_initializer = 'he_normal'), Conv2D(1024, 3, activation = 'relu', padding = 'same', kernel_initializer = 'he_normal'), Conv2D(1024, 3, activation = 'relu', padding = 'same', kernel_initializer = 'he_normal'), UpSampling2D(size = (2,2)), Conv2D(512, 2, activation = 'relu', padding = 'same', kernel_initializer = 'he_normal'), Conv2D(512, 3, activation = 'relu', padding = 'same', kernel_initializer = 'he_normal'), Conv2D(512, 3, activation = 'relu', padding = 'same', kernel_initializer = 'he_normal'), Conv2D(512, 3, activation = 'relu', padding = 'same', kernel_initializer = 'he_normal'), UpSampling2D(size = (2,2)), Conv2D(256, 2, activation = 'relu', padding = 'same', kernel_initializer = 'he_normal'), Conv2D(256, 3, activation = 'relu', padding = 'same', kernel_initializer = 'he_normal'), Conv2D(256, 3, activation = 'relu', padding = 'same', kernel_initializer = 'he_normal'), Conv2D(256, 3, activation = 'relu', padding = 'same', kernel_initializer = 'he_normal'), UpSampling2D(size = (2,2)), Conv2D(128, 2, activation = 'relu', padding = 'same', kernel_initializer = 'he_normal'), Conv2D(128, 3, activation = 'relu', padding = 'same', kernel_initializer = 'he_normal'), Conv2D(128, 3, activation = 'relu', padding = 'same', kernel_initializer = 'he_normal'), Conv2D(128, 3, activation = 'relu', padding = 'same', kernel_initializer = 'he_normal'), UpSampling2D(size = (2,2)), Conv2D(64, 2, activation = 'relu', padding = 'same', kernel_initializer = 'he_normal'), Conv2D(64, 3, activation = 'relu', padding = 'same', kernel_initializer = 'he_normal'), Conv2D(64, 3, activation = 'relu', padding = 'same', kernel_initializer = 'he_normal'), Conv2D(64, 3, activation = 'relu', padding = 'same', kernel_initializer = 'he_normal'), Conv2D(1, 3, activation = 'linear', padding = 'same', kernel_initializer = 'he_normal') ]) y = model(x)

3条回答

网友

1楼 · 编辑于 2024-06-23 20:02:29

进一步的讨论可以在https://www.tensorflow.org/guide/gpu找到，您应该阅读它

网友

2楼 · 编辑于 2024-06-23 20:02:29

您可以这样动态分配内存：

from keras.backend.tensorflow_backend import set_session

config=tf.ConfigProto()
config.gpu_options.allow_growth=True
sess = tf.Session(config=config)
set_session(sess)

网友

3楼 · 编辑于 2024-06-23 20:02:29

您需要限制GPU内存的增长，您可以在TensorFlow page上找到一个示例代码

我还复制了代码片段：

gpus = tf.config.experimental.list_physical_devices('GPU')
if gpus:
# Restrict TensorFlow to only use the first GPU
try:
    f.config.experimental.set_visible_devices(gpus[0], 'GPU')
    logical_gpus = tf.config.experimental.list_logical_devices('GPU')
    print(len(gpus), "Physical GPUs,", len(logical_gpus), "Logical GPU")
except RuntimeError as e:
    # Visible devices must be set before GPUs have been initialized
    print(e)

我在我的一些项目中也遇到过同样的问题，我注意到如果批量较大，那么GPU内存就会出现问题。尝试将批处理大小设置为尽可能小。当模型比较复杂时，我从批量大小1开始

相关问题更多 >

编程相关推荐

热门问题

热门文章