MulticlassClassificationEvaluator和MultilabelClassificationEvaluator是PySpark中众多分类算法评估器中的两个。我无法找到/理解这两个评估器之间的区别。
回答:
第一个用于评估将给定数据分类到特定单一类别(标签)的模型,但该模型可以处理多个类别(标签)(参见维基百科)。例如,您可以将网站分类为在线商店、商业、游戏、健康等。
第二个适用于数据可能属于多个类别和多个标签的情况(参见维基百科)。继续网站的例子,例如,一个在线销售药品的网站可以同时被分类为“在线商店”和“健康”。