如何确定libsvm中最佳的C/Gamma参数?

我正在使用libsvm对具有大量特征/属性(每个项目约5800个)的数据集进行多类分类。我希望选择比我目前使用的默认值更好的C和Gamma参数。

我已经尝试运行easy.py,但对于我使用的数据集,估计的时间几乎是无限的(在20、50、100和200个数据样本上运行easy.py,得到了一个超线性回归,预测我需要的运行时间将以年计算)。

有没有办法比默认值更快地找到更好的C和Gamma值?我使用的是Java库,如果这有什么不同的话。


回答:

这是可以不通过网格搜索来实现的,我认为easy.py就是这样做的。

看看Trevor Hastie等人发表的这篇论文:支持向量机的整个正则化路径(PDF)。一次”SVM运行”可以一次性计算所有”C”值的损失,因此您可以看到它如何影响您的SVM性能。

他们有一个这个算法的实现,您可以通过R中的svmpath包来使用。

我认为该算法的核心是用Fortran编写的,但被包装在R中。

Related Posts

使用LSTM在Python中预测未来值

这段代码可以预测指定股票的当前日期之前的值,但不能预测…

如何在gensim的word2vec模型中查找双词组的相似性

我有一个word2vec模型,假设我使用的是googl…

dask_xgboost.predict 可以工作但无法显示 – 数据必须是一维的

我试图使用 XGBoost 创建模型。 看起来我成功地…

ML Tuning – Cross Validation in Spark

我在https://spark.apache.org/…

如何在React JS中使用fetch从REST API获取预测

我正在开发一个应用程序,其中Flask REST AP…

如何分析ML.NET中多类分类预测得分数组?

我在ML.NET中创建了一个多类分类项目。该项目可以对…

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注