当新的观测值填充时,需要自动更新训练集。
我在Python中使用sklearn库的随机梯度下降算法。我将数据框转换为数组,但仍然在转换过程中遇到问题。我按照以下步骤操作:
错误:我期望的输出应该是模型拟合的结果,但实际输出是
ValueError. File "/home/system/anaconda3/lib/python3.7/site-packages/sklearn/utils/multiclass.py", line 96, in unique_labels raise ValueError("Unknown label type: %s" % repr(ys))ValueError: Unknown label type: (array([1. , 2. , 3. , 3.8 , 4. , 4.25, 5. ]),)
回答:
从堆栈跟踪中,我发现了两个问题:
ySGD
是一个元组,但它应该是numpy数组(可能是该元组的第一个也是唯一元素)- 您使用的是
SGDClassifier
,但您的标签是实数(在数据框中被称为“score”)。这表明您的任务实际上是一个回归问题,因此您应该使用SGDRegressor