我使用GloVe词嵌入训练了一个模型,并保存了模型的架构和权重。我想对模型的网络进行一些小的更改,然后重新训练模型。以下是我的代码:
#Load back model, change architecture, train, predictfrom keras import regularizersfrom keras import layersfrom keras.models import load_modeldef create_model(): model = Sequential() model.add(Embedding(max_fatures, embed_dim,input_length = X_train.shape[1])) model.add(Bidirectional(LSTM(150, return_sequences=True, dropout= 0.1, recurrent_dropout=0.1))) model.add(GlobalMaxPool1D()) model.add(Dense(50, activation="relu")) model.add(Dropout(0.1)) model.add(Dense(6, activation="sigmoid")) #Load GloVe model.layers[0].set_weights([embedding_matrix]) model.layers[0].trainable = False model = load_model('/content/model_num2.h5') model.fit(X_train,y_train, nb_epoch=2, batch_size=32, show_accuracy=True, validation_split=0.1, verbose=2) return(model)model2 = create_model()
当我调用model2时,出现了错误。错误信息是:
ValueError: Cannot create group in read only mode.
我在create_model()函数中修改了一些前面的层,我最终的目的是使用之前保存的权重重新训练模型,并在测试集上进行预测。
任何帮助都将不胜感激!
编辑:忘记发布模型编译的部分。已在函数中添加。
回答:
我不理解你的代码,你创建了一个新的Model
,但没有compile
它,而是load
了一个新的模型,这会覆盖你的模型吗?
-
作为一个规则,你应该从头开始重写你的模型,因为一旦编译,它就不再是可变的。通过访问你的模型对象的属性/
print_summary
,你可以查看模型的架构 -
每个权重都是为特定架构优化的,不确定使用来自另一架构的预训练权重是否能节省计算时间,反而增加了过拟合的风险