使用OpenCV随机森林进行回归

我之前使用随机森林进行分类任务,设置参数时参考了这里的示例,效果很好。现在我想解决一个回归问题。

我大致了解这与随机森林训练方法中定义数据类型的var_type Mat有关,但不太确定这些标志各自对应什么。

对于分类任务,它看起来像这样(代码从上面的链接复制):

// 将所有属性定义为数值型
// 替代方案是CV_VAR_CATEGORICAL或CV_VAR_ORDERED(=CV_VAR_NUMERICAL)
// 可以按每个属性基础分配
Mat var_type = Mat(ATTRIBUTES_PER_SAMPLE + 1, 1, CV_8U );
var_type.setTo(Scalar(CV_VAR_NUMERICAL) ); // 所有输入都是数值型
// 这是一个分类问题(即预测离散数量的类别输出)
// 因此将最后一个(+1)输出var_type元素重置为CV_VAR_CATEGORICAL
var_type.at<uchar>(ATTRIBUTES_PER_SAMPLE, 0) = CV_VAR_CATEGORICAL;

参数设置如下:

float priors[] = {1,1,1,1,1,1,1,1,1,1};  // 每个分类的权重(所有数字的样本均等)
CvRTParams params = CvRTParams(25, // 最大深度
                                5, // 最小样本数
                                0, // 回归精度:这里不适用
                            false, // 计算代理分裂,没有缺失数据
                                                                   15, // 最大类别数(对于更大的数字使用次优算法)
                            priors, // 先验概率数组
                            false,  // 计算变量重要性
                                4,       // 在节点处随机选择的变量数量,用于查找最佳分裂
                              100,   // 森林中的最大树数
                             0.01f,             // 森林精度
         CV_TERMCRIT_ITER | CV_TERMCRIT_EPS // 终止条件
                                  );

训练使用var_type和params如下:

CvRTrees* rtree = new CvRTrees;
rtree->train(training_data, CV_ROW_SAMPLE, training_classifications,
                 Mat(), Mat(), var_type, Mat(), params);

我的问题是如何设置OpenCV随机森林,使其作为回归器工作。我已经搜索了很多,但没有找到答案。最接近的解释是我在这里找到的回答。然而,它仍然没有意义。

我正在寻找一个简单的答案,解释回归的var_type和params设置。


回答:

要将其用于回归,您只需将var_type设置为CV_VAR_ORDERED,即

var_type.at<uchar>(ATTRIBUTES_PER_SAMPLE, 0) = CV_VAR_ORDERED;

并且您可能希望将回归精度设置为一个非常小的数字,如0.0001f。

Related Posts

Keras Dense层输入未被展平

这是我的测试代码: from keras import…

无法将分类变量输入随机森林

我有10个分类变量和3个数值变量。我在分割后直接将它们…

如何在Keras中对每个输出应用Sigmoid函数?

这是我代码的一部分。 model = Sequenti…

如何选择类概率的最佳阈值?

我的神经网络输出是一个用于多标签分类的预测类概率表: …

在Keras中使用深度学习得到不同的结果

我按照一个教程使用Keras中的深度神经网络进行文本分…

‘MatMul’操作的输入’b’类型为float32,与参数’a’的类型float64不匹配

我写了一个简单的TensorFlow代码,但不断遇到T…

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注