抱歉标题描述得不够清楚,我实在是找不到更好的表达方式。举个例子,假设我有一组数据,分为三个类别:积极、中性和消极,然后我用这些数据训练了一个分类器。现在我想知道,如果这个分类器预测结果是中性,它是更接近积极的中性还是消极的中性。
我能想到的最直接的方法是检查第二高的可能性,或者考虑所有可能性但赋予不同的权重/系数。
这种类型的问题有没有专门的术语?我应该阅读哪些论文?非常感谢。
回答:
具体的回答取决于你计划使用的算法(如朴素贝叶斯、三类支持向量机、谱聚类等)和实现(分析框架)。你寻找的度量属于“评分”范畴。大多数这些方法都允许你以编程方式访问评估函数。
根据你的数据空间,找到训练边界(以便你知道哪个更接近)可能是一个更大的问题,因为边界可能不是线性的,甚至没有良好的空间表示。
至于要阅读的论文…(1)在不知道你预期应用的更多信息的情况下,我只能建议你去阅读关于机器学习以及分类与评分的资料;(2)在StackOverflow上,请求资源参考是一种被禁止的问题类型。
这是否给你提供了一个有用的方向?