假设我有一组训练数据。我训练模型来预测整数温度,比如1度、2度、3度、4度、5度。这些输出温度就是标签。如果我想预测介于两个温度之间的值,比如2.5度,该怎么做呢?不可能为每一个温度值都进行训练。我该如何实现这一点呢?
回答:
听起来你训练的是离散分类,但你想要连续输出。你应该将算法切换为回归,而不是分类。
另一种可能性是利用最后一层的输出进行插值。使用分配给最佳选择及其最强邻近选择的权重。例如,如果你的分类结果是
1 .012 .053 .564 .245 .14
… 你可以用56份3
和24份4
进行插值,得到3.7度
作为你的输出。
这对你有帮助吗?
更新
(1) 如何从分类切换到回归?
这个问题对于Stack Overflow来说过于宽泛;你需要先做好研究。分类和回归之间的差异不小。你需要提出一个具体的问题,这需要发布一个新的问题,包括你当前的代码和你尝试进行切换的工作。
(2) 在从输出预测值时,我怎么知道我在寻找3.7度…?
在预测时,你并不知道;这应该是在训练时考虑的问题。我给出的例子只是一个可能结果的说明。因为你没有提供数据的细节,我编造了一个例子。
(3) 我应该选择哪部分?
我建议你选择最佳猜测(即原本将是你的整数值分类的那个),以及相邻值中更可能的那个。在我的例子中,3
是最佳猜测。你查看2
和4
,发现4
比2
更可能,所以用4
作为插值的另一个端点。