使用 GridSearchCV
调优 SVR 的超参数时,有什么更好的选择方法?我了解到 GridSearchCV
的输入是一组 C
、gamma
和 epsilon
的值。 GridSearchCV
算法会评估这些值,并在给定的输入值集中建议最佳值。如何选择要作为输入的值集?除了试错法之外,有没有更好的选择方法?试错法耗时,而且可能会错过超参数的最优值。
回答:
如往常一样,好的超参数范围取决于问题本身。很难找到一个适合所有问题的解决方案。
文献推荐的 epsilon
值在 1-e3
到 1
之间。对于 C
参数,一个好的超参数空间应该在 1
到 100
之间。过大的 C
值只会使训练数据过拟合。
gamma
已经由 scikit-learn 的 SVR
计算。我不会更改它。
别忘了你还可以调优 kernel
,这可能是最重要的超参数需要调优的。
总之,寻找最佳超参数范围时没有免费的午餐。最好的选择是阅读文献和文档,并理解每个参数的影响。