我开始观看Coursera上Andrew Ng的机器学习视频。在关于分类的课程(第三个视频)中,他说了以下几句话
“再一次强调,决策边界是训练集的属性,而非假设和参数的属性。
但是一旦你有了参数theta,就是这些参数定义了决策边界。”
我的问题是:
-
训练集和假设之间有什么区别?
-
为什么决策边界是假设的属性而不是训练集的属性?
回答:
你可以这样理解:
对于任何给定的参数集,都有一个唯一的决策边界。因此,参数唯一地定义了决策边界。
另一方面,给定训练数据,并没有唯一的决策边界。你可以选择基本上是无限多的不同决策边界来适应任何一组数据。因此,数据无法唯一定义决策边界,因此边界不能是数据的属性。
另一方面,正如他所指出的,你可以使用训练数据来选择参数,然后得到一个边界。但有许多方法可以做到这一点。