Keras：在编译过程中输入形状未知时，如何创建一个具有权重的自定义层？

class PreprocessLayer(Layer): """ Defines a layer that applies the preprocessing from a scaler Needed because lambda layers are too fragile to be saved in a model """ def __init__(self, batch_size, mean, var, **kwargs): self.b = batch_size self.m = mean self.v = var super(PreprocessLayer, self).__init__(**kwargs) def build(self, input_shape): self.mean = self.add_weight(name='mean', shape=(self.b,input_shape[1]), initializer=tf.constant_initializer(self.m), trainable=False) self.var = self.add_weight(name='var', shape=(self.b,input_shape[1]), initializer=tf.constant_initializer(self.v), trainable=False) super(PreprocessLayer, self).build(input_shape) # Be sure to call this at the end def call(self, x): return (x-self.mean)/self.var def compute_output_shape(self, input_shape): return (input_shape[0],input_shape[1]) def get_config(self): config = super(PreprocessLayer, self).get_config() config['mean'] = self.m config['var'] = self.v return config

tensorflow.python.framework.errors_impl.InvalidArgumentError: Incompatible shapes: [32,15] vs. [20,15] [[Node: preprocess_layer_1/sub = Sub[T=DT_FLOAT, _device="/job:localhost/replica:0/task:0/device:CPU:0"](_arg_IN_0_0, preprocess_layer_1/mean/read)]]

2条回答

网友

1楼 · 编辑于 2024-06-26 00:20:11

我不认为您需要添加mean和{}作为权重。您可以在call函数中计算它们。我也不太明白为什么要用这个来代替BatchNormalization，但是无论如何，也许你可以试试这个代码

class PreprocessLayer(Layer):
    def __init__(self, eps=1e-6, **kwargs):
        self.eps = eps
        super(PreprocessLayer, self).__init__(**kwargs)
    def build(self, input_shape):
        super(PreprocessLayer, self).build(input_shape)
    def call(self, x):
        mean = K.mean(x, axis=-1, keepdims=True)
        std = K.std(x, axis=-1, keepdims=True)
        return (x - mean) / (std + self.eps)
    def compute_output_shape(self, input_shape):
        return input_shape

eps是为了避免被0除。在

我不能保证这会奏效，但也许可以试试。在

网友

2楼 · 编辑于 2024-06-26 00:20:11

对于任何有相同问题的人-这是一个余数不同于时代结束时的批处理大小（由于培训和测试大小不是批大小的倍数），这是我的解决办法。在

由于余数的大小始终小于批处理大小，因此我在call函数中所做的是将权重切片如下：

def call(self, x):                                                                                                                                            
        mean = self.mean[:K.shape(x)[0],:]                                                                                                                       
        std = self.std[:K.shape(x)[0],:]                                                                                                                        
        return (x-mean)/std

这是可行的，但这意味着如果使用大于初始化层的批处理大小来评估模型，则错误将再次弹出。在

这就是为什么我在__init__中输入： self.b = max(32,batch_size)。在

因为predict（）默认使用batch_size=32

相关问题更多 >

编程相关推荐

热门问题

热门文章