批量归一化在小批量大小下能工作吗?

我在人脸检测中使用批量大小为10的批量归一化。

批量归一化能在如此小的批量大小下工作吗?如果不能,那么我可以使用什么其他方法进行归一化?


回答:

是的,它适用于较小的尺寸,即使你设置了最小的尺寸也能工作。

诀窍在于批量大小也增加了正则化效果,而不仅仅是批量归一化。我将展示几张图片给你看:

bs=10

我们使用相同的尺度来跟踪批量损失。左侧是没有批量归一化层的模块(黑色),右侧是有批量归一化层的模块。请注意,即使在bs=10时,正则化效果也是显而易见的。

bs=64

当我们设置bs=64时,批量损失的正则化效果非常明显。请注意,y轴的尺度始终是[0, 4]

我的测试仅基于nn.BatchNorm1d(10, affine=False),没有可学习的参数gammabeta,即wb

这就是为什么在批量大小较低时,使用批量归一化层是有意义的。

Related Posts

使用LSTM在Python中预测未来值

这段代码可以预测指定股票的当前日期之前的值,但不能预测…

如何在gensim的word2vec模型中查找双词组的相似性

我有一个word2vec模型,假设我使用的是googl…

dask_xgboost.predict 可以工作但无法显示 – 数据必须是一维的

我试图使用 XGBoost 创建模型。 看起来我成功地…

ML Tuning – Cross Validation in Spark

我在https://spark.apache.org/…

如何在React JS中使用fetch从REST API获取预测

我正在开发一个应用程序,其中Flask REST AP…

如何分析ML.NET中多类分类预测得分数组?

我在ML.NET中创建了一个多类分类项目。该项目可以对…

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注