我使用的是Ubuntu 19.04(Disco Dingo)、Python 3.7.3和TensorFlow 1.14.0。
我注意到tensorflow.keras.Sequential.predict函数给出的输出数量与输入数量不同。此外,输入和输出之间似乎没有任何关系。
示例:
我总是得到的输出是:
(输入,正确答案,预测答案)
[0, 0] 0 0[0, 1] 1 0[1, 0] 1 0[1, 1] 0 0
或者
[0, 0] 0 1[0, 1] 1 1[1, 0] 1 1[1, 1] 0 1
因此,尽管我认为网络已经过度训练,尽管程序显示准确率为100%且损失几乎为零,但输出看起来像是网络根本没有训练过。
更奇怪的是,当我用以下代码替换测试部分时:
print("testing")m = tf.cast([], tf.float64)values = model.predict(m, steps=1)print(values)
我认为这应该返回一个空数组或抛出异常。相反,它给出的是:
[[0.9979249 0.00207507] [0.10981816 0.89018184] [0.10981816 0.89018184] [0.9932179 0.0067821 ]]
这对应于[0,1,1,0]
所以即使没有给出任何预测对象,它仍然会给出某些预测的输出。而且看起来这些预测与我们将整个训练集发送到预测方法中所期望的结果相匹配。
再次替换测试部分:
print("testing")m = tf.cast([[0,0]], tf.float64)# [0,0] 是第一个训练样本# 输出应该接近于 [[1.0,0.0]]values = model.predict(m, steps=1)for j in range(len(values)): print(values[j])exit()
我得到的是:
[0.9112452 0.08875483][0.00552484 0.9944752 ][0.00555605 0.99444395][0.9112452 0.08875483]
这对应于[0,1,1,0]
所以要求它在零输入上进行预测,会得到4个预测。要求它在一个输入上进行预测,也会得到4个预测。此外,它给出的预测看起来像是我们将整个训练集放入预测函数中所期望的结果。
有什么想法吗?如何让我的网络对每个给定的输入准确地给出一个预测?
回答:
在此提供解决方案(答案部分),尽管它已出现在评论部分,为了社区的利益。
将Tensorflow
从1.14.0
升级到>=2.0
已经解决了这个问题。
升级后,测试部分按预期工作
m = tf.cast([[0,0]], tf.float64)# [0,0] 是第一个训练样本# 输出应该接近于 [[1.0,0.0]]values = model.predict(m, steps=1)for j in range(len(values)): print(values[j])exit()
输出:
[0.9921625 0.00783745]