能否有人解释一下,为什么关联规则学习被认为是一种监督学习方法?我理解的是,算法会处理一组连贯的数据集,并基于这些集合计算关联:
{a, b, c}{a, b, d}=> a -> b=> b -> a
在我看来,这些只是任意的数据集。没有特定的目标向量。为什么这被称为监督学习呢?
回答:
我认为,如果有人将关联规则学习
视为无监督
或监督学习任务
,这是一个开放的讨论。虽然维基百科将其归类为监督学习算法,但其他资源则将其归类为无监督学习算法:
与决策树和规则集归纳不同,后者生成分类模型,关联规则学习是一种无监督学习方法,没有为示例分配类别标签。
机器学习和数据挖掘 – 施普林格
我认为这取决于实际学习部分是如何实现的。可以创建一组训练数据 - 标签
对,如你的示例所示:
{a, b, c}{a, b, d}=> a -> b=> b -> a
有了数百或数千个这样的对,我认为可以训练一个神经网络来理解数据集中潜在的模式,并且精度相当高。这将是一种监督学习任务
,其中神经网络从预分类示例中学习。
另一方面,如果算法是基于支持度 – 置信度 – 提升度 – 确信度来计算关联的,那么这将是一种无监督学习任务
。