我正在尝试使用SK learn对带标签的时间序列数据进行线性回归。我的数据格式为data=(timestamp,value,label)
我的数据被分配的标签是0或1。我尝试按照SKLearn网站上的这个示例进行操作
我的问题是:
1- 示例中的训练数据标签在哪里?它们是在diabetes_y_train
中吗?
2- 方法predict()的返回值是什么?在我的代码中,它返回一个n_samples大小的数组,预测值在[0,1]范围内。然而,我期望返回的是0或1的二进制值(没有中间值)
回答:
1 – diabetes_y_train
是训练数据的标签
2 – 您使用的是回归函数,因此返回连续变量是正确的。如果您想要二进制输出,那么您解决的不是回归问题,而是分类问题,您可以设置一个阈值来离散化预测,或者使用sklearn提供的分类器。