根据杰夫·希顿的《用Java介绍神经网络》,Kohonen神经网络的输入必须是-1到1之间的值。
如果事先知道范围,可以对输入进行归一化:例如RGB (125, 125, 125),其范围已知为0到255之间的值:
1. 除以255:(125/255) = 0.5 >> (0.5,0.5,0.5)
2. 乘以2并减去1:((0.5*2)-1)=0 >> (0,0,0)
问题是如何对像身高或体重这样范围未知的输入进行归一化。
此外,其他一些论文提到输入必须归一化为0到1之间的值。正确的归一化方式是“-1到1”还是“0到1”?
回答:
你总是可以使用压缩函数将无限区间映射到有限区间。例如,你可以使用tanh.
你可能想要使用tanh(x * l),其中l是手动选择的,以避免将太多对象放置在同一区域。如果你估计数据的最大值为正负500,你可能想要使用tanh(x / 1000)作为映射,其中x是你的对象的值。甚至可以考虑从x中减去你对均值的估计,得到tanh((x – mean) / max)。