如何强制 Keras VGG16 模型在新的自定义模型中显示并包含详细层

摘要:如何强制keras.applications.VGG16的层(而不是vgg模型)在新的自定义模型中显示并作为层包含。

详细信息:

  1. 我在keras.applications.VGG16(记为conv_base)之上构建自定义模型(记为model)。具体来说,我用自己的层替换了最后的全连接层。

    conv_base = VGG16(weights='imagenet',  # 使用ImageNet预训练
              include_top=False,  # 排除顶部的三层
              input_shape=(64, 64, 3),
              pooling = 'max')
    model = models.Sequential()
    model.add(conv_base)
    model.add(layers.BatchNormalization())
    model.add(layers.Dropout(0.2))
    model.add(layers.Dense(256, activation='linear'))
    model.add(layers.BatchNormalization())
    model.add(layers.Dropout(0.2))
    model.add(layers.Dense(1, activation='linear'))
  2. 虽然通过conv_base.summary()可以看到conv_base中的层,但在model.summary()时,新的自定义模型只能看到vgg16层(类型为Model),而不是vgg16内的每一层(如图所示)。

    conv_base.summary()

图1:conv_base中显示了所有层。

    model.summary()

图2:vgg的详细层未包含在模型结构中,而是作为Model包含。

  1. 相关问题

尽管可以通过model.get_layer('vgg16').layers访问vgg层,但这仍然偶尔会导致其他问题,包括:

(1) 加载权重:有时会搞乱权重加载过程。

    model.load_weights('~path/weights.hdf5')  

加载权重时的错误

(2) 构建新模型:在调用model层来构建新模型时也会导致错误。

    model2 = Model(inputs=model.inputs, outputs=model.get_layer('vgg16').layers[1].output, name='Vis_Model') 

调用层构建新模型时的错误

思考:我可以想象通过将keras.application.VGG的层逐一复制到新模型中来部分解决这个问题。但如何使用预训练的权重可能会是个问题。欢迎任何其他建议。


回答:

编辑:根据您的评论,这里是更新后的解决方案。

您可以通过迭代层并将它们附加到顺序模型来展平嵌套模型。以下代码中我使用了一个很棒的解决方案

import numpy as np
import tensorflow as tf
from tensorflow.keras.applications import VGG16
from tensorflow.keras import layers, Model, utils
# 实例化VGG模型
conv_base = VGG16(weights='imagenet',  # 使用ImageNet预训练
                  include_top=False,  # 排除顶部的三层
                  input_shape=(64, 64, 3),
                  pooling = 'max')
# 定义次级嵌套模型
inp = layers.Input((64,64,3))
cnn = conv_base(inp)
x = layers.BatchNormalization()(cnn)
x = layers.Dropout(0.2)(x)
x = layers.Dense(256, activation='linear')(x)
x = layers.BatchNormalization()(x)
x = layers.Dropout(0.2)(x)
out = layers.Dense(1, activation='linear')(x)
model = Model(inp, out)
# 展平嵌套模型
def flatten_model(model_nested):
    layers_flat = []
    for layer in model_nested.layers:
        try:
            layers_flat.extend(layer.layers)
        except AttributeError:
            layers_flat.append(layer)
    model_flat = tf.keras.models.Sequential(layers_flat)
    return model_flat
model_flat = flatten_model(model)
model_flat.summary()

Related Posts

使用LSTM在Python中预测未来值

这段代码可以预测指定股票的当前日期之前的值,但不能预测…

如何在gensim的word2vec模型中查找双词组的相似性

我有一个word2vec模型,假设我使用的是googl…

dask_xgboost.predict 可以工作但无法显示 – 数据必须是一维的

我试图使用 XGBoost 创建模型。 看起来我成功地…

ML Tuning – Cross Validation in Spark

我在https://spark.apache.org/…

如何在React JS中使用fetch从REST API获取预测

我正在开发一个应用程序,其中Flask REST AP…

如何分析ML.NET中多类分类预测得分数组?

我在ML.NET中创建了一个多类分类项目。该项目可以对…

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注