我知道以下几点:
- 无监督学习是试图在未标记的数据中寻找隐藏的结构,否则,我们称之为有监督学习。
- 回归也是一种分类,但它的输出是无限的数值。
- 我还知道分类是有监督学习的一种类型。
但让我感到困惑的是:
- 线性回归(线拟合)是回归的一种类型吗?如果是,为什么它的数据是未标记的?例如,它的样本数据只是一些坐标,如(1,2)、(2,3)、(1,4)?
- 逻辑回归(分类)是回归的一种类型吗?如果是,为什么它的输出只是名义上的(值,真或假,0或1)?
有谁能帮我解答这些问题吗?
回答:
1) 线性回归是有监督的,因为你拥有的数据包括输入和输出(可以这么说)。例如,如果你有一个关于汽车销售的数据集。对于每辆车,你有品牌、型号、价格、颜色、折扣等信息,但你还有每辆车的销售数量。如果这是一个无监督的任务,你的数据集可能只包括品牌、型号、价格、颜色等(不包括实际的销售数量),你能做的最好的事情就是对数据进行聚类。这个例子虽然不完美,但旨在传达大致的概念。在决定一个方法是否是有监督的时,一个好的问题是问自己“有没有办法判断输入的质量?”。如果你有线性回归数据,你当然可以。你只需评估函数(在这种情况下,是直线)在输入数据上的值来估计输出。在另一种情况下则不行。
2) 逻辑回归实际上并不是回归。这个名字具有误导性,确实会导致很多混乱。它通常只用于二元预测,这使它非常适合分类任务,但不适合其他任务。