我想知道在scikitlearn的Python模块中是否有内置的函数可以检索分类错误的文档。
这很简单,我通常自己编写代码,通过比较预测和测试向量,并从测试文档数组中检索文档。但我想问的是,是否有内置的功能可以替代我在每个Python代码中复制这种功能。
回答:
如果你有一组文档的真实标签列表y_test
,例如["ham", "spam", "spam", "ham"]
,并将其转换为NumPy数组,那么你可以用一行代码将其与预测进行比较:
import numpy as np
y_test = np.asarray(y_test)
misclassified = np.where(y_test != clf.predict(X_test))
现在misclassified
是一个指向X_test
的索引数组。
@隐藏人名 说得对,这种功能在scikit-learn中没有实现,因为用户应该熟悉NumPy,能够自己用几行代码完成。