Home IT技术如何在存在权重时对glmnet中的变量进行标准化？

如何在存在权重时对glmnet中的变量进行标准化？

IT技术 xiaolong · 2025年4月12日 · 0 Comment

glmnet允许用户通过weights参数输入观测权重的向量。glmnet还会默认将预测变量标准化为零均值和单位方差。我的问题是：当提供了weights时，glmnet是使用每个列的加权均值（和标准差）还是未加权均值（和标准差）来标准化预测变量的？

回答：

关于glmnet标准化的描述可以在链接中找到

在帖子中，您可以看到glmnet源代码中计算标准化的Fortran代码片段。（“证明”段落，第二个项目）。

我不熟悉Fortran，但在我看来，它似乎确实使用了加权均值和标准差。

编辑：来自glmnet的示例说明：

“weights用于观测权重。每个观测的默认值为1。（注意：glmnet将权重重新缩放，使其总和等于N，即样本大小。）”

在Fortran代码中，w是重新缩放的权重，这似乎与加权均值标准化是一致的。

a-star glmnet machine-learning

发表回复取消回复