以下是X
和Y
变量的形状:
X_train, X_test, y_train, y_test = train_test_split(X, Y, test_size=0.33, random_state=42)## 形状输出 X_train.shape = (970, 298) X_test.shape = (478, 298)len(y_train) = 970len(y_test) = 478
现在我分配了Multi-output
分类器来自Knn
:
knn = KNeighborsClassifier(n_neighbors=3)classifier = MultiOutputClassifier(knn, n_jobs=-1)classifier.fit(X_train,y_train)predictions = classifier.predict(X_test)print classifier.score(y_test,predictions)
当我尝试运行这个时,我得到了以下错误:
ValueError: X和Y矩阵的维度不兼容: X.shape[1] == 3 而 Y.shape[1] == 298
现在我可以看出错误与变量的形状有关,可能是我在进行训练或测试时混淆了它们。
我尝试搜索但没有找到答案,我犯了什么错误?
样本 :
X = (0, 96) 0.24328157992528274(0, 191) 0.4086854706249901(0, 279) 0.3597892480519696(0, 209) 0.6262243704015803(0, 287) 0.15142673105175225(0, 44) 0.2839334104854308(0, 31) 0.27493029497336746(0, 62) 0.2702778021025414Y =[1252, 12607, 12596], [12480, 12544, 12547], [1252, 12607, 12547], [12480, 12607, 12547], [12480, 12607, 12596], [1252, 12607, 12547], [12480, 12544, 12547], [1252, 12607, 12596], [1252, 12607, 12596], [12480, 12544, 12547], [12480, 12607, 12596]
回答:
来自 文档:
返回给定测试数据和标签的平均准确率。在多标签分类中,这是子集准确率,这是一个严格的指标,因为你需要对每个样本的每个标签集进行正确预测。参数: X : 类数组, 形状 = (n_samples, n_features)测试样本。y : 类数组, 形状 = (n_samples) 或 (n_samples, n_outputs) X的真实标签。sample_weight : 类数组, 形状 = [n_samples], 可选样本权重。返回: score : float相对于y的self.predict(X)的平均准确率
因此,你需要为评分函数提供X
和y
,而不是y_true
和y_pred
尝试:
print classifier.score(X_test, np.array(y_test))