我使用顺序模型是因为在我的实际数据中,顺序很重要。所以我用一个非常简单的问题来测试。
使用这种数据结构,因为我的实际项目使用的是这种结构。
Keras模型应该能够找到每个4元素数组的元素之和,并返回结果数组。
我是机器学习的新手。
我的结果总是得到相同的低准确率。
- 如果我切换到PyTorch会有所不同吗?
- 我的层设置有问题吗?
代码:
import numpy as npfrom tensorflow import kerasfrom tensorflow.keras.models import Sequentialfrom tensorflow.keras.layers import Dense, Dropout, Activationfrom tensorflow.keras import activationsfrom tensorflow.python.keras.optimizer_v2.adam import Adam x_train = np.random.randint(2, size=(200,50, 4))y_train = []for i in x_train: b = [] for j in i: b.append(sum(j)) y_train.append(b)y_train = np.asarray(y_train)model = Sequential()model.add(Dense(50, input_shape=(50,4), activation='relu'))model.add(Dropout(0.5))model.add(Dense(50, activation='relu'))model.add(Dropout(0.5))model.add(Dense(1))model.compile(optimizer=Adam(), loss='mean_squared_error', metrics=['accuracy'])model.fit(x_train, y_train, batch_size=50, epochs=150)x_test = np.random.randint(2, size=(2,50, 4))y_test = model.predict(x_test)
更新后的结果样本,准确率为0.3:
[1.8860947] [1 1 0 0][1.8860947] [1 1 0 0][2.8001838] [1 0 1 1][0.9009073] [0 0 1 0][1.8860947] [1 1 0 0][0.9719887] [0 1 0 0][1.0507569] [1 0 0 0][1.8607054] [0 0 1 1][2.8148863] [0 1 1 1][3.6628482] [1 1 1 1][0.9719887] [0 1 0 0][3.6628482] [1 1 1 1][1.8607054] [0 0 1 1][0.9009073] [0 0 1 0][1.9050169] [0 1 1 0]
回答:
据我所知,你试图获得线性结果,然而你在输出层使用了非线性激活。Softmax输出预测结果,你应该在数据集中有超过两个类别时使用它,即在制作分类模型时。它的元素总和总是1。更改以下代码行可能会有所帮助:
model.add(Dense(1))model.compile(optimizer=Adam(), loss='mean_squared_error')