为什么小数据集会有高方差?

为什么小数据集会有高方差?我们的教授曾经提到过,但我没有理解。任何帮助都将不胜感激。

提前感谢。


回答:

当我们进入职业生涯时,每个人都已经接触到了比AI研究人员可用的最大数据集还要大的视觉数据集。除此之外,我们还有来自外部感官的声音、气味、触觉和味觉数据。总的来说,人类对人类世界有大量的背景知识。我们对人类情况有普遍的常识理解。在分析数据集时,我们将数据本身与我们过去的知识结合起来,以得出分析结果。

典型的机器学习算法则没有这些——它只有你展示给它的数据,而且这些数据必须是标准化格式。如果数据中不存在某个模式,算法就无法学习到它。这就是为什么在给定小数据集时,它更容易出错。

Related Posts

使用LSTM在Python中预测未来值

这段代码可以预测指定股票的当前日期之前的值,但不能预测…

如何在gensim的word2vec模型中查找双词组的相似性

我有一个word2vec模型,假设我使用的是googl…

dask_xgboost.predict 可以工作但无法显示 – 数据必须是一维的

我试图使用 XGBoost 创建模型。 看起来我成功地…

ML Tuning – Cross Validation in Spark

我在https://spark.apache.org/…

如何在React JS中使用fetch从REST API获取预测

我正在开发一个应用程序,其中Flask REST AP…

如何分析ML.NET中多类分类预测得分数组?

我在ML.NET中创建了一个多类分类项目。该项目可以对…

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注