神经网络正弦函数逼近

在尝试使用神经网络进行Q学习失败了好几天后,我决定回归基础,做一个简单的函数逼近,看看一切是否正常运作,并观察一些参数对学习过程的影响。以下是我编写的代码

from keras.models import Sequentialfrom keras.layers import Denseimport matplotlib.pyplot as pltimport randomimport numpyfrom sklearn.preprocessing import MinMaxScalerregressor = Sequential()regressor.add(Dense(units=20, activation='sigmoid', kernel_initializer='uniform', input_dim=1))regressor.add(Dense(units=20, activation='sigmoid', kernel_initializer='uniform'))regressor.add(Dense(units=20, activation='sigmoid', kernel_initializer='uniform'))regressor.add(Dense(units=1))regressor.compile(loss='mean_squared_error', optimizer='sgd')#regressor = ExtraTreesRegressor()N = 5000X = numpy.empty((N,))Y = numpy.empty((N,))for i in range(N):    X[i] = random.uniform(-10, 10)X = numpy.sort(X).reshape(-1, 1)for i in range(N):    Y[i] = numpy.sin(X[i])Y = Y.reshape(-1, 1)X_scaler = MinMaxScaler()Y_scaler = MinMaxScaler()X = X_scaler.fit_transform(X)Y = Y_scaler.fit_transform(Y)regressor.fit(X, Y, epochs=2, verbose=1, batch_size=32)#regressor.fit(X, Y.reshape(5000,))x = numpy.mgrid[-10:10:100*1j]x = x.reshape(-1, 1)y = numpy.mgrid[-10:10:100*1j]y = y.reshape(-1, 1)x = X_scaler.fit_transform(x)for i in range(len(x)):    y[i] = regressor.predict(numpy.array([x[i]]))plt.figure()plt.plot(X_scaler.inverse_transform(x), Y_scaler.inverse_transform(y))plt.plot(X_scaler.inverse_transform(X), Y_scaler.inverse_transform(Y))

问题是我的所有预测值都集中在0附近。如你所见,我使用了来自sklearn的ExtraTreesRegressor(已注释的代码行)来检查协议是否确实正确。那么我的神经网络哪里出了问题?为什么它不起作用?

(我实际要解决的问题是使用神经网络计算山地车问题的Q函数。这与这个函数逼近器有什么不同?)


回答:

通过以下更改:

  • 激活函数改为relu
  • 移除kernel_initializer(即保留默认的'glorot_uniform'
  • 使用Adam优化器
  • 设定100个训练周期

regressor = Sequential()regressor.add(Dense(units=20, activation='relu', input_dim=1)) regressor.add(Dense(units=20, activation='relu')) regressor.add(Dense(units=20, activation='relu')) regressor.add(Dense(units=1))regressor.compile(loss='mean_squared_error', optimizer='adam')regressor.fit(X, Y, epochs=100, verbose=1, batch_size=32)

其余代码保持不变,结果如下:

enter image description here

不断尝试,再尝试…

Related Posts

L1-L2正则化的不同系数

我想对网络的权重同时应用L1和L2正则化。然而,我找不…

使用scikit-learn的无监督方法将列表分类成不同组别,有没有办法?

我有一系列实例,每个实例都有一份列表,代表它所遵循的不…

f1_score metric in lightgbm

我想使用自定义指标f1_score来训练一个lgb模型…

通过相关系数矩阵进行特征选择

我在测试不同的算法时,如逻辑回归、高斯朴素贝叶斯、随机…

可以将机器学习库用于流式输入和输出吗?

已关闭。此问题需要更加聚焦。目前不接受回答。 想要改进…

在TensorFlow中,queue.dequeue_up_to()方法的用途是什么?

我对这个方法感到非常困惑,特别是当我发现这个令人费解的…

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注