大家好,我在使用libSVM进行预测时发现了一个奇怪的现象。
当我没有设置任何SVM参数时,测试集上的表现达到了99.9%。然而,当我设置参数为’-c 10 -g 5’时,测试集上的精确度大约只有33%。
顺便提一下,我使用的SVM工具包是LibSVM。
我想知道是否是数据集出了问题。我无法判断哪个结果更有说服力。
回答:
你碰巧遇到了一个问题,其中C
和gamma
的默认值(分别为1和1/num_features)效果很好。
gamma=5
远大于默认值。当默认值接近最优时,gamma=5
很可能导致非常差的结果。大gamma
和大C
的组合是过拟合的完美配方(例如,训练集表现高而测试集表现低)。