例如,我有二进制数据,如下所示:0, 0, 0, 1, 1, 0, 1, 1。这些数据可能会无限持续。对于每个输入,都有相应的输出。假设我们使用异或(XOR)操作,那么输出可能看起来像这样:0, 0, 0, 1, 0, 1, 1, 0。
我如何设置Keras的输入形状?我如何设置时间步长?如果我声明时间步长为1,每个时间步长是否被视为不同的情况,或者它是否仍然可以将之前的输入作为序列或学习到的记忆来考虑?
Keras使用LSTM或GRU作为其隐藏层。
我尝试了两种方法来解决这个问题,但似乎都没有成功。两种方法都停留在37.5%的准确率。事实上,它一直猜测1。
方法1:
data = [[[0], [0], [0], [1], [1], [0], [1], [1]]]output = [[[0], [0], [0], [1], [0], [1], [1], [0]]]model = Sequential()model.add(GRU(10, input_shape=(8, 1), return_sequences=True))model.add(GRU(10, return_sequences=True))model.add(Dense(1, activation='softmax'))model.compile(loss='binary_crossentropy', optimizer='adam', metrics=['acc'])model.fit(np.asarray(data), np.asarray(output), epochs=3000)
方法2:
data = [[[0]], [[0]], [[0]], [[1]], [[1]], [[0]], [[1]], [[1]]]output = [[0], [0], [0], [1], [0], [1], [1], [0]]model = Sequential()model.add(GRU(10, input_shape=(1, 1), return_sequences=True))model.add(GRU(10))model.add(Dense(1, activation='softmax'))model.compile(loss='binary_crossentropy', optimizer='adam', metrics=['acc'])model.fit(np.asarray(data), np.asarray(output), epochs=300)
回答:
事实上,它一直猜测1。
这是因为你在最后一层使用了softmax
作为激活函数。由于最后一层只有一个单元,并且softmax函数将其输入标准化,使元素之和等于1,它总是输出1。相反,你需要使用sigmoid
作为最后一层的激活函数,以获得介于零和一之间的输出。