最近我在考虑使用R还是Python来训练支持向量机的问题。
除了两种编程语言本身的优缺点之外,我想知道是否有基于这些软件包本身的启发性指导原则来帮助做出决定。
我考虑的是模型训练速度、可扩展性、不同核函数的可用性以及其他与性能相关的方面。
面对不同大小的数据集,如何决定选择哪条路径呢?
我提前为这个问题可能有些模糊而道歉。
回答:
我没有使用e1070的经验,但通过谷歌搜索发现它似乎使用或基于LIBSVM(我对R的了解不足以从cran条目中确定是哪一种)。Scilearnkit也使用LIBSVM。
在这两种情况下,模型都将由LIBSVM进行训练。速度、可扩展性、可用选项的多样性将完全相同,使用这些库的SVM时,你将面临的主要限制是LIBSVM的限制。
我想,除非你在问题中澄清一些事情,否则给出进一步的建议将是困难的:你的目标是什么?你已经了解LIBSVM了吗?这是学习项目吗?谁在支付你的时间?你在Python还是R中感觉更舒服?