我一周前开始使用libsvm进行工作。
我找不到关于libsvm参数的任何信息。
我想更好地理解我应该如何选择这些参数。
能有人用简单的话告诉我每个参数的含义吗?
-d degree-g gamma-r coef0-c cost-n nu-p epsilon-m cachesize-e epsilon-h shrinking-b probability_estimates-wi weight
在这种情况下(向量),什么参数值会是最好的?
回答:
参数的描述可以在libsvm的主页面上找到。那里有几个论文的链接,展示了希腊字母变量的数学用法,包括支持向量分类实用指南。
一般来说,你可以将参数值保持在默认值。然后,你可以一次调整一个参数,看看这些变化如何影响你所需的特性。
为了帮助你了解一些主要参数:
- degree … 这是多项式核函数的度数(最高指数)。这是一个转换函数,应用于你的数据点,试图获得类别之间更准确的线性划分。高度数会导致过拟合;低度数会损失准确性。
- gamma & r … 核的领先系数和常数(偏置)参数。
- -e epsilon … 收敛容差;较小的值需要更多的迭代才能收敛。
总体来说,论文为你提供了开发SVM模型的一系列良好建议。我建议你逐步完成这些步骤,并在你遇到具体的编程问题时再发帖讨论。
至于为你的数据集选择参数,我们无法在不分析数据的“形状”和范围以及不知道你需要的结果的情况下给你一个好的起始集。简而言之,我们需要从你那里了解更多,然后逐步完成你作为模型开发者需要做的工作。
这些建议能让你朝着正确的方向前进吗?