我在Keras中训练了一个仅包含全连接层的模型。然而,当我尝试预测时,无论输入值如何变化,总是得到相同的答案。
import numpyfrom keras.models import Sequentialfrom keras.layers import Densefrom keras.layers import LSTMfrom keras.layers import Dropoutfrom keras.layers.embeddings import Embeddingfrom keras.optimizers import Adamimport pandas as pdimport tensorflow as tftf.python.control_flow_ops = tfdf = pd.read_csv('/home/sam/Documents/data.csv')dfX = df[['Close']]dfY = df[['Y']]bobX = dfX.as_matrix()boby = dfY.as_matrix()model = Sequential()model.add(Dense(200, input_dim=1))model.add(Activation('sigmoid'))model.add(Dense(75))model.add(Activation('sigmoid'))model.add(Dense(10))model.add(Activation('sigmoid'))model.add(Dense(1))adam = Adam(lr=0.1)model.compile(loss='mse', optimizer= adam)print(model.summary())model.fit(bobX, boby, nb_epoch=2500, batch_size=500, verbose=0)model.predict(np.array([[210.99]]))
回答:
你的Adam优化器的学习率设置得太高了。实际上,0.1对于我使用的大多数优化器来说都太高了。你应该使用1e-3或1e-4作为学习率。这些通常对我来说效果很好。当你使用如此高的学习率时,模型将无法收敛。根据我的经验,它通常会停留在问题的常数平均值上。