大家好!
我遇到了一个大麻烦,因为SVC运行时间太长了。而且我无法对数据进行归一化,因为数据是稀疏的,且矩阵的尺寸对于密集表示来说太大了。我通过
sklearn.preprocessing.scale
对数据进行了缩放,但这还不够。有什么方法可以加速SVC的计算吗?
回答:
1) 购买一台拥有超大内存的机器,以便缓存整个gram矩阵。缓存大小对LibSVM的性能影响最大,而scikit-learn正是使用了LibSVM。
2) 使用不同的算法。scikit-learn已经调用了LibSVM,这可能是可用的基于SMO的SVM实现中最快的。