在Keras中实现条件批归一化

我正在尝试在Keras中实现条件批归一化。我假设需要创建一个自定义层，因此，我扩展了Keras团队的Normalization源代码。
我的想法是：我将有3个条件，因此，我需要初始化3个不同的beta和gamma参数。然后，我在需要的地方加入了条件语句。请注意，我的条件在每次迭代后随机变化，并且尝试基于3个全局Keras变量c1、c2和c3来设置条件。
这是我目前的代码。由于条件语句的原因，它会报错。有什么改进或在Keras中实现条件批归一化的建议吗：
更新：
from keras import regularizers, initializers, constraintsfrom keras.legacy import interfacesimport keras.backend as Kfrom keras.layers import Layer, Input, InputSpecfrom keras.models import Modelimport tensorflow as tfglobal c1, c2, c3c1 = K.variable([0])c2 = K.variable([0])c3 = K.variable([0])class ConditionalBatchNormalization(Layer):"""条件批归一化层。"""@interfaces.legacy_batchnorm_supportdef __init__(self,              axis=-1,             momentum=0.99,             epsilon=1e-3,             center=True,             scale=True,             beta_initializer='zeros',             gamma_initializer='ones',             moving_mean_initializer='zeros',             moving_variance_initializer='ones',             beta_regularizer=None,             gamma_regularizer=None,             beta_constraint=None,             gamma_constraint=None,             **kwargs):    super(ConditionalBatchNormalization, self).__init__(**kwargs)    self.axis = axis    self.momentum = momentum    self.epsilon = epsilon    self.center = center    self.scale = scale    self.beta_initializer = initializers.get(beta_initializer)    self.gamma_initializer = initializers.get(gamma_initializer)    self.moving_mean_initializer = initializers.get(moving_mean_initializer)    self.moving_variance_initializer = (        initializers.get(moving_variance_initializer))    self.beta_regularizer = regularizers.get(beta_regularizer)    self.gamma_regularizer = regularizers.get(gamma_regularizer)    self.beta_constraint = constraints.get(beta_constraint)    self.gamma_constraint = constraints.get(gamma_constraint)def build(self, input_shape):    dim = input_shape[0][self.axis]    if dim is None:        raise ValueError('Axis ' + str(self.axis) + ' of '                         'input tensor should have a defined dimension '                         'but the layer received an input with shape ' +                         str(input_shape[0]) + '.')    shape = (dim,)    if self.scale:        self.gamma1 = self.add_weight(shape=shape,                                     name='gamma',                                     initializer=self.gamma_initializer,                                     regularizer=self.gamma_regularizer,                                     constraint=self.gamma_constraint)        self.gamma2 = self.add_weight(shape=shape,                                     name='gamma',                                     initializer=self.gamma_initializer,                                     regularizer=self.gamma_regularizer,                                     constraint=self.gamma_constraint)        self.gamma3 = self.add_weight(shape=shape,                                     name='gamma',                                     initializer=self.gamma_initializer,                                     regularizer=self.gamma_regularizer,                                     constraint=self.gamma_constraint)    else:        self.gamma1 = None        self.gamma2 = None        self.gamma3 = None    if self.center:        self.beta1 = self.add_weight(shape=shape,                                    name='beta',                                    initializer=self.beta_initializer,                                    regularizer=self.beta_regularizer,                                    constraint=self.beta_constraint)        self.beta2 = self.add_weight(shape=shape,                                    name='beta',                                    initializer=self.beta_initializer,                                    regularizer=self.beta_regularizer,                                    constraint=self.beta_constraint)        self.beta3 = self.add_weight(shape=shape,                                    name='beta',                                    initializer=self.beta_initializer,                                    regularizer=self.beta_regularizer,                                    constraint=self.beta_constraint)    else:        self.beta1 = None        self.beta2 = None        self.beta3 = None    self.moving_mean = self.add_weight(        shape=shape,        name='moving_mean',        initializer=self.moving_mean_initializer,        trainable=False)    self.moving_variance = self.add_weight(        shape=shape,        name='moving_variance',        initializer=self.moving_variance_initializer,        trainable=False)    super(ConditionalBatchNormalization, self).build(input_shape) def call(self, inputs, training=None):    input_shape = K.int_shape(inputs[0])    c1 = inputs[1][0]    c2 = inputs[2][0]    # 准备广播形状。    ndim = len(input_shape)    reduction_axes = list(range(len(input_shape)))    del reduction_axes[self.axis]    broadcast_shape = [1] * len(input_shape)    broadcast_shape[self.axis] = input_shape[self.axis]    # 确定是否需要广播。    needs_broadcasting = (sorted(reduction_axes) != list(range(ndim))[:-1])    def normalize_inference():        if needs_broadcasting:            # 在这种情况下，我们必须明确地广播所有参数。            broadcast_moving_mean = K.reshape(self.moving_mean,                                              broadcast_shape)            broadcast_moving_variance = K.reshape(self.moving_variance,                                                  broadcast_shape)            if self.center:                broadcast_beta = \                    tf.case({                                c1: lambda: K.reshape(self.beta1,                                                      broadcast_shape),                                c2: lambda: K.reshape(self.beta2,                                                      broadcast_shape)                            },                                default=lambda: K.reshape(self.beta3,                                                          broadcast_shape)                            )            else:                broadcast_beta = None            if self.scale:                broadcast_gamma = \                    tf.case({                                c1: lambda: K.reshape(self.gamma1,                                                      broadcast_shape),                                c2: lambda: K.reshape(self.gamma2,                                                      broadcast_shape)                            },                                default=lambda: K.reshape(self.gamma3,                                                          broadcast_shape)                            )            else:                broadcast_gamma = None            return K.batch_normalization(                inputs[0],                broadcast_moving_mean,                broadcast_moving_variance,                broadcast_beta,                broadcast_gamma,                axis=self.axis,                epsilon=self.epsilon)        else:            out = \            tf.case({                    c1: lambda: K.batch_normalization(                                        inputs[0],                                        self.moving_mean,                                        self.moving_variance,                                        self.beta1,                                        self.gamma1,                                        axis=self.axis,                                        epsilon=self.epsilon),                    c2: lambda: K.batch_normalization(                                        inputs[0],                                        self.moving_mean,                                        self.moving_variance,                                        self.beta2,                                        self.gamma2,                                        axis=self.axis,                                        epsilon=self.epsilon)                },                    default=lambda: K.batch_normalization(                                        inputs[0],                                        self.moving_mean,                                        self.moving_variance,                                        self.beta3,                                        self.gamma3,                                        axis=self.axis,                                        epsilon=self.epsilon)                        )            return out    # 如果学习阶段是*静态*并且设置为推理：    if training in {0, False}:        return normalize_inference()    # 如果学习阶段是动态的，或设置为训练：    normed_training, mean, variance = \        tf.case({                    c1: lambda: K.normalize_batch_in_training(                            inputs[0], self.gamma1, self.beta1, reduction_axes,                            epsilon=self.epsilon),                    c2: lambda: K.normalize_batch_in_training(                            inputs[0], self.gamma2, self.beta2, reduction_axes,                            epsilon=self.epsilon)                },                    default=lambda: K.normalize_batch_in_training(                            inputs[0], self.gamma3, self.beta3, reduction_axes,                            epsilon=self.epsilon)                )    print(normed_training)    if K.backend() != 'cntk':        sample_size = K.prod([K.shape(inputs[0])[axis]                              for axis in reduction_axes])        sample_size = K.cast(sample_size, dtype=K.dtype(inputs[0]))        if K.backend() == 'tensorflow' and sample_size.dtype != 'float32':            sample_size = K.cast(sample_size, dtype='float32')        # 样本方差 - 总体方差的无偏估计        variance *= sample_size / (sample_size - (1.0 + self.epsilon))    self.add_update([K.moving_average_update(self.moving_mean,                                             mean,                                             self.momentum),                     K.moving_average_update(self.moving_variance,                                             variance,                                             self.momentum)],                    inputs[0])    # 选择与训练阶段对应的归一化形式。    return K.in_train_phase(normed_training,                            normalize_inference,                            training=training)def get_config(self):    config = {        'axis': self.axis,        'momentum': self.momentum,        'epsilon': self.epsilon,        'center': self.center,        'scale': self.scale,        'beta_initializer': initializers.serialize(self.beta_initializer),        'gamma_initializer': initializers.serialize(self.gamma_initializer),        'moving_mean_initializer':            initializers.serialize(self.moving_mean_initializer),        'moving_variance_initializer':            initializers.serialize(self.moving_variance_initializer),        'beta_regularizer': regularizers.serialize(self.beta_regularizer),        'gamma_regularizer': regularizers.serialize(self.gamma_regularizer),        'beta_constraint': constraints.serialize(self.beta_constraint),        'gamma_constraint': constraints.serialize(self.gamma_constraint)    }    base_config = super(ConditionalBatchNormalization, self).get_config()    return dict(list(base_config.items()) + list(config.items()))def compute_output_shape(self, input_shape):    return input_shape[0]if __name__ == '__main__':    x = Input((10,))    c1 = Input(batch_shape=(1,), dtype=tf.bool)    c2 = Input(batch_shape=(1,), dtype=tf.bool)    h = ConditionalBatchNormalization()([x, c1, c2])    model = Model([x, c1, c2], h)    model.compile(optimizer=Adam(1e-4), loss='mse')    c1 = K.constant([False]*100, dtype=tf.bool)    c2 = K.constant([True]*100, dtype=tf.bool)    X = np.random.rand(100, 10)    Y = np.random.rand(100, 10)    model.train_on_batch(x=[X, c1, c2], y=Y)    c1 = K.constant([False]*100, dtype=tf.bool)    c2 = K.constant([True]*100, dtype=tf.bool)    model.train_on_batch(x=[X, c1, c2], y=Y)
回答：
学技术

在Keras中实现条件批归一化

发表回复取消回复

相关文章：

Related Posts

使用LSTM在Python中预测未来值

如何在gensim的word2vec模型中查找双词组的相似性

dask_xgboost.predict 可以工作但无法显示 – 数据必须是一维的

ML Tuning – Cross Validation in Spark

如何在React JS中使用fetch从REST API获取预测

如何分析ML.NET中多类分类预测得分数组？

发表回复 取消回复

发表回复取消回复