为什么我在Keras中使用前馈神经网络对独立的训练、验证和测试数据集获得100%的准确率？

今天我正在开发一个分类器，用于根据蘑菇的特征检测其是否有毒。数据存储在一个.csv文件中（读取到pandas DataFrame），数据链接将在文末提供。

我使用了sci-kit learn的train_test_split函数将数据分为训练和测试集。

然后，我移除了训练和测试标签中指定蘑菇是否有毒的列，并将其分配给了yTrain和yTest变量。

之后，我对数据应用了一键编码（使用pd.get_dummies()），因为参数是分类数据。

此后，我对训练和测试的输入数据进行了归一化处理。

本质上，训练和测试的输入数据是一组独特的经过一键编码的参数，而输出数据是一组一和零的列表，代表输出（一表示有毒，零表示可食）。

我使用了Keras和一个简单的前馈网络来完成这个项目。这个网络由三层组成；一个简单的Dense层（对于PyTorch用户来说是线性层）包含300个神经元，一个包含100个神经元的Dense层，以及一个包含两个神经元的Dense层，每个神经元代表给定蘑菇参数是有毒还是可食的概率。我使用的优化器是Adam，损失函数是稀疏分类交叉熵。

我训练了网络60个周期。大约5个周期后，损失基本为零，我的准确率达到了1。训练结束后，我担心网络可能过拟合了，所以我在不同的测试数据上进行了尝试。结果与训练和验证数据相同；准确率达到了100%，我的损失可以忽略不计。

在50个周期结束时，我的验证损失为2.258996e-07，训练损失为1.998715e-07。我的测试损失为4.732502e-09。我对这种情况感到非常困惑，损失应该这么低吗？我认为我没有过拟合，我的验证损失只是比训练损失略高一些，所以我也不认为我有欠拟合的情况。

你们中有谁知道这个问题的答案吗？如果我犯了什么愚蠢的错误，我深感抱歉。

数据集链接：https://www.kaggle.com/uciml/mushroom-classification

回答：

看起来那个Kaggle数据集是可解的，意思是你可以创建一个模型，100%的时间都能给出正确答案（如果这些结果是可信的话）。如果你查看那些结果，你会发现作者实际上能够找到使用几种方法（包括决策树）达到100%准确率的模型。

学技术

为什么我在Keras中使用前馈神经网络对独立的训练、验证和测试数据集获得100%的准确率？

发表回复取消回复

相关文章：

Related Posts

使用LSTM在Python中预测未来值

如何在gensim的word2vec模型中查找双词组的相似性

dask_xgboost.predict 可以工作但无法显示 – 数据必须是一维的

ML Tuning – Cross Validation in Spark

如何在React JS中使用fetch从REST API获取预测

如何分析ML.NET中多类分类预测得分数组？

发表回复 取消回复

发表回复取消回复