我是 Keras 的初学者,刚刚写了一个玩具示例。它报告了一个 TypeError
。代码和错误如下:
代码:
inputs = keras.Input(shape=(3, ))cell = keras.layers.SimpleRNNCell(units=5, activation='softmax')label = keras.layers.RNN(cell)(inputs)model = keras.models.Model(inputs=inputs, outputs=label)model.compile(optimizer='rmsprop', loss='mae', metrics=['acc'])data = np.array([[1, 2, 3], [3, 4, 5]])labels = np.array([1, 2])model.fit(x=data, y=labels)
错误:
Traceback (most recent call last): File "/Users/david/Documents/code/python/Tensorflow/test.py", line 27, in <module> run() File "/Users/david/Documents/code/python/Tensorflow/test.py", line 21, in run label = keras.layers.RNN(cell)(inputs) File "/Users/david/anaconda3/lib/python3.6/site-packages/tensorflow/python/keras/layers/recurrent.py", line 619, in __call__... File "/Users/david/anaconda3/lib/python3.6/site-packages/tensorflow/python/ops/init_ops.py", line 473, in __call__ scale /= max(1., (fan_in + fan_out) / 2.)TypeError: unsupported operand type(s) for +: 'NoneType' and 'int'
那么我该如何处理这个问题呢?
回答:
RNN 层的输入应具有形状 (num_timesteps, num_features)
,即每个样本由 num_timesteps
个时间步组成,每个时间步是一个长度为 num_features
的向量。此外,时间步的数量(即 num_timesteps
)可以是可变的或未知的(即 None
),但特征的数量(即 num_features
)应从一开始就是固定的并指定。因此,您需要更改输入层的形状以与 RNN 层保持一致。例如:
inputs = keras.Input(shape=(None, 3)) # 可变数量的时间步,每个时间步长度为3inputs = keras.Input(shape=(4, 3)) # 4个时间步,每个时间步长度为3inputs = keras.Input(shape=(4, None)) # 这是错误的!您不能这样做。特征数量必须是固定的
然后,您还需要更改输入数据(即 data
)的形状,以与您指定的输入形状保持一致(即必须具有形状 (num_samples, num_timesteps, num_features)
)。
作为补充说明,您可以使用 SimpleRNN
层直接定义 RNN 层,方法更简单:
label = keras.layers.SimpleRNN(units=5, activation='softmax')(inputs)