为什么小数据集会有高方差?我们的教授曾经提到过,但我没有理解。任何帮助都将不胜感激。
提前感谢。
回答:
当我们进入职业生涯时,每个人都已经接触到了比AI研究人员可用的最大数据集还要大的视觉数据集。除此之外,我们还有来自外部感官的声音、气味、触觉和味觉数据。总的来说,人类对人类世界有大量的背景知识。我们对人类情况有普遍的常识理解。在分析数据集时,我们将数据本身与我们过去的知识结合起来,以得出分析结果。
典型的机器学习算法则没有这些——它只有你展示给它的数据,而且这些数据必须是标准化格式。如果数据中不存在某个模式,算法就无法学习到它。这就是为什么在给定小数据集时,它更容易出错。