有人说不同的算法有不同的参数。我不太认同这种说法,例如决策树算法和朴素贝叶斯算法,它们各自的参数是什么?谁能举个例子说明一下吗?
如果确实如此,那么对将要使用决策树算法运行的数据进行5折交叉验证与使用贝叶斯算法进行5折交叉验证会有所不同吗?
另外,对于参数优化,我也将进行5折交叉验证。有没有办法使用Weka自动执行此操作来确定参数的关键值集合?
回答:
既然你正在使用 Weka,你可以通过在 Explorer
中打开数据集,转到 Classify
,选择算法,然后单击算法框来查看每个算法的参数。例如,朴素贝叶斯分类器具有影响其处理连续数据方式的参数(离散化或使用核估计器)。