我有近60万行的数据,包含26个特征。我在训练一个用于分类的神经网络,验证集上的准确率从99到25不等。在某些轮次中它达到99,而在下一轮次中有时会下降到25。这可能是什么原因导致的?
回答:
尽管你的回答很宽泛,但这可能会对你有所帮助。我在StackExchange上找到了一个很好的回答。
查看这个回答,我认为这可能是由于验证数据点的某些部分被随机分类。拥有26个不同的特征可能是一个很大的劣势——分类器可能无法找到模式,因为有些特征只是噪音,精确度不够,甚至与你的目的相悖,导致随机分类。
另一个可能的问题是你的学习率。如果学习率太低,你可能会错过损失景观中的好点。因此,根据你的运气,你可能会遇到好的或坏的点。
我的建议是进行一些数据科学工作,以找出对结果影响最大的特征。查看这篇Medium文章,以找到一些好的技术。如果这没有带来任何进展,尝试一些正则化技术,并选择一个合适的学习率。
如果什么都不奏效,请向我们提供更多关于你的数据集和训练细节的信息。