我刚开始学习Keras,所以我想尝试创建一个我能想到的最简单的回归问题,作为一种“hello world”的练习。
我想训练一个模型,输出输入值的两倍。我认为一个有两个节点(一个输入一个输出)且没有激活函数的神经网络应该能做到。权重应该简单地收敛到2。
这是我的代码:
layers = keras.layers# Feed forward structuremodel = keras.Sequential()model.add(layers.Dense(1))model.add(layers.Dense(1))model.compile(optimizer=tf.train.AdamOptimizer(0.01), loss='mae', metrics=['mae'])train_data = np.asarray([x for x in range(100)])train_labels = np.asarray([x * 2 for x in train_data])model.fit(train_data, train_labels, epochs=50, batch_size=32)
然而,当我输入一个一维的numpy数组时,它会崩溃并显示以下错误:
ValueError: The last dimension of the inputs to `Dense` should be defined. Found `None`.
如果我在train_data
上添加多余的括号,它就能编译(但不收敛):
train_data = np.asarray([[x for x in range(100)]])Epoch 50/501/1 [==============================] - 0s 705us/step - loss: 50.0463 - mean_absolute_error: 50.0463
回答:
如果您给模型输入一个单一的数字,每个输入样本的形状必须是(1,)
。因此,所有的100个输入样本的形状应该是(100,1)
。因此,您需要使输入数据和标签的形状与预期的一致:
train_data = train_data.reshape(100,1) # 100 samples of shape 1# you may not need to do the following necessarilytrain_labels = train_labels.reshape(100,1) # 100 labels of shape 1# alternative way using np.expand_dimstrain_data = np.expand_dims(train_data, axis=-1)
附注:
-
您的模型有两个
Dense
层。根据您的描述,我认为您只需要一个具有一个单元的Dense
层(即删除其中一个Dense
层)。 -
当您将数据放入另一个列表中,像这样:
train_data = np.asarray([[x for x in range(100)]])
它会变成一个形状为
(1,100)
的二维数组,这意味着一个形状为(100,)
的单一样本,这不是您想要的。