在寻找用于推文分类问题的算法时,我遇到了SVM。我从LibSVM
开始,使用其Java库(而不是命令行)实现了一个系统,线性函数的效果大约在50%-60%之间。现在我希望通过模型选择、缩放、交叉验证和特征选择来提高我的准确性。问题是,我在LibSVM
的Java库中找不到这些功能。那么,作为一名Java程序员,我有哪些选择?如果选项是自己编写这些功能,该怎么做,用什么算法?我是否应该选择其他机器学习库或算法来完成这项任务?
回答:
SVM中的模型选择过程可以帮助你根据函数的不同参数选择最佳模型。在LibSVM库中,模型选择是通过交叉验证方法完成的。它的作用是将你的训练数据分成几个子集,并每次使用不同的参数和每组数据来训练模型,以提高准确性。这也避免了过拟合问题。