是否有方法可以用某个分类类型的平均值来填补其缺失值?例如,如果我有50种独特的产品,产生了1000个样本,其中一个特征是重量。我能否用产品“a”的重量平均值来填补产品“a”的重量,用产品“c”的重量平均值来填补产品“c”的重量?
回答:
如果你使用pandas,可以尝试如下方法:
原始数据框:
category weight0 a 1.01 a 1.02 a NaN3 a 2.04 b NaN5 b 3.06 b 3.07 b 3.0
结果:
category weight0 a 1.01 a 1.02 a 1.03 a 2.04 b 3.05 b 3.06 b 3.07 b 3.0