假设我有过去5年的数据,并且我已经基于这些数据训练了一个分类器(例如决策树、支持向量机等),即给定了适当的输入特征数据和正确的输出标签。
现在,当前年份需要进行预测(预测输出)时,我可以提供当前年份的输入特征数据,分类器将预测正确的输出标签。
到目前为止,一切顺利。
然而,假设我没有当前的输入特征数据,我该如何仅基于过去的数据进行预测呢?
例如选举预测,即预测每个选区哪个政党会获胜。在这种情况下,我们有大量的过去数据,但没有当前的输入特征数据,那么该如何处理呢?
回答:
Bogatron的评论是正确的答案。如果你不使用输入特征并要求返回一个标签,那么分类器就不是正确的途径。基于过去数据对未来进行建模通常是通过回归来完成的。最简单的做法可能是最小二乘法,这将允许你选择一个简单的模型(想想曲线拟合),从中你可以选择一个数据点并计算预测值。