我想了解用于评估算法准确性/优劣的各种技术
和指标
,以及如何使用给定的指标来得出关于机器学习模型的结论。
一种方法是使用精确度和召回率,如维基百科中所定义。另一种方法是使用准确率指标,如这里所解释的。因此,我想知道是否还有其他用于评估机器学习模型的指标?
回答:
我之前整理了一份用于评估分类和回归算法的指标列表,形式为速查表。一些用于分类的指标包括:精确度、召回率、敏感性、特异性、F-measure、Matthews相关系数等。这些都基于混淆矩阵。对于回归(连续输出变量)也存在其他指标。
技术主要是运行算法在一些数据上得到一个模型,然后将该模型应用于新的、之前未见过的数据,并在该数据集上评估指标,并重复这一过程。
一些技术(实际上是来自统计学的重抽样技术):
- Jacknife
- 交叉验证
- K折验证
- 自助法。