如何使用R中的遗传算法优化CART的参数

为了训练支持向量机,我们必须确定各种参数。

例如,有cp和minsplit这样的参数。

我目前使用交叉验证来寻找这些参数,并且得到了cp=0.02的结果。

以下是相关的代码:

library(caTools)set.seed(3000)spl = sample.split(dat$Incident.Category, SplitRatio = 0.8)Train = subset(dat, spl==TRUE)Test = subset(dat, spl==FALSE)library(caret)library(e1071)# 定义交叉验证实验numFolds = trainControl( method = "cv", number = 10 )cpGrid = expand.grid( .cp = seq(0.01,0.5,0.01)) train(Incident.Category ~ Working.Condition + Observation.Type +Injury.Potential.Score + Equipment.Damage.Score  + Safety.Standards + Incident.Type, data = Train, method = "rpart", trControl = numFolds, tuneGrid = cpGrid )CartMOdel = rpart(Incident.Category ~ Working.Condition + Observation.Type + Injury.Potential.Score+ Equipment.Damage.Score  + Safety.Standards + Incident.Type,data = Train, method="class", cp = 0.02)

现在我想知道如何使用遗传算法来优化这些参数。我的数据是分类数据,所以我对如何选择适应度函数也感到困惑。


回答:

只有一个参数。使用遗传算法没有意义。

相反,网格搜索更合适。

Related Posts

L1-L2正则化的不同系数

我想对网络的权重同时应用L1和L2正则化。然而,我找不…

使用scikit-learn的无监督方法将列表分类成不同组别,有没有办法?

我有一系列实例,每个实例都有一份列表,代表它所遵循的不…

f1_score metric in lightgbm

我想使用自定义指标f1_score来训练一个lgb模型…

通过相关系数矩阵进行特征选择

我在测试不同的算法时,如逻辑回归、高斯朴素贝叶斯、随机…

可以将机器学习库用于流式输入和输出吗?

已关闭。此问题需要更加聚焦。目前不接受回答。 想要改进…

在TensorFlow中,queue.dequeue_up_to()方法的用途是什么?

我对这个方法感到非常困惑,特别是当我发现这个令人费解的…

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注