我是机器学习的新手。我一直在尝试运行这段代码,但损失值一直停留在1.12,既不增加也不减少。任何帮助都将不胜感激。
import pandas as pdimport numpy as npimport tensorflow as tfimport matplotlib.pyplot as pltdataset = pd.read_csv('Iris.csv')#for rncoding labelfrom sklearn.preprocessing import LabelEncoderencoder = LabelEncoder()dataset["Labels"] = encoder.fit_transform(dataset["Species"])X = dataset.iloc[:,1:5]Y = dataset['Labels']from sklearn.model_selection import train_test_splitX_train, X_test, y_train, y_test = train_test_split(X, Y, test_size=0.33, random_state=42)X_train = np.array(X_train).astype(np.float32)X_test = np.array(X_test).astype(np.float32)y_train = np.array(y_train).astype(np.float32)y_test = np.array(y_test).astype(np.float32)model = tf.keras.models.Sequential([ tf.keras.layers.Dense(8, input_shape=(4,), activation='relu'), tf.keras.layers.Dense(3, activation='softmax')])opt = tf.keras.optimizers.Adam(0.01)model.compile(optimizer=opt, loss='mse')r = model.fit(X_train, y_train, validation_data=(X_test, y_test), epochs=50)
回答:
这是一个分类问题,您需要预测Iris植物的类别(来源)。您指定了mse损失,即“均方误差”。它测量预测值与实际值之间的平均偏差。平方确保对较大偏差的惩罚高于对较小偏差的惩罚。这种损失用于回归问题,当您需要预测像价格、点击量、销售量等连续值时。
以下是一些有帮助的建议:
- 将损失函数更改为分类损失函数。categorical_cross_entropy在这里是一个不错的选择。无需过多细节,分类问题中的模型输出某个样本属于某个类的得分。您使用的softmax函数将这些得分转换为归一化的概率。交叉熵损失确保当模型对错误类别给出高概率时受到惩罚。
- 尝试将数据标准化为0均值和单位方差。这有助于模型的收敛。
您可以参考这篇文章,了解如何为Iris数据集构建神经网络。