Home IT技术处理机器学习分类中列的无限/大值

处理机器学习分类中列的无限/大值

IT技术 xiaolong · 2025年5月28日 · 0 Comment

使用公式计算了一个列（公式不涉及任何对数函数，仅使用.sum()进行分组），但不出所料，该列会产生如下的无限/指数值：

-inf nan inf-3.000e+32 7.3297+23 ...等（类似数据）

我的疑问是如何处理这一列，因为在二分类问题中我无法避免使用这一列进行预测。在将这一列用于模型分类之前，有哪些技术可以使用？

谢谢！

回答：

如果你的计算特征（该列）的函数返回nan或inf，我会感到怀疑。这是为什么呢？

一般来说，如果你有像你这样的很大值，你可以尝试应用对数变换来将你的值缩放到更有用的区间。

classification machine-learning missing-data python

发表回复取消回复