我之前使用随机森林进行分类任务,设置参数时参考了这里的示例,效果很好。现在我想解决一个回归问题。
我大致了解这与随机森林训练方法中定义数据类型的var_type Mat有关,但不太确定这些标志各自对应什么。
对于分类任务,它看起来像这样(代码从上面的链接复制):
// 将所有属性定义为数值型
// 替代方案是CV_VAR_CATEGORICAL或CV_VAR_ORDERED(=CV_VAR_NUMERICAL)
// 可以按每个属性基础分配
Mat var_type = Mat(ATTRIBUTES_PER_SAMPLE + 1, 1, CV_8U );
var_type.setTo(Scalar(CV_VAR_NUMERICAL) ); // 所有输入都是数值型
// 这是一个分类问题(即预测离散数量的类别输出)
// 因此将最后一个(+1)输出var_type元素重置为CV_VAR_CATEGORICAL
var_type.at<uchar>(ATTRIBUTES_PER_SAMPLE, 0) = CV_VAR_CATEGORICAL;
参数设置如下:
float priors[] = {1,1,1,1,1,1,1,1,1,1}; // 每个分类的权重(所有数字的样本均等)
CvRTParams params = CvRTParams(25, // 最大深度
5, // 最小样本数
0, // 回归精度:这里不适用
false, // 计算代理分裂,没有缺失数据
15, // 最大类别数(对于更大的数字使用次优算法)
priors, // 先验概率数组
false, // 计算变量重要性
4, // 在节点处随机选择的变量数量,用于查找最佳分裂
100, // 森林中的最大树数
0.01f, // 森林精度
CV_TERMCRIT_ITER | CV_TERMCRIT_EPS // 终止条件
);
训练使用var_type和params如下:
CvRTrees* rtree = new CvRTrees;
rtree->train(training_data, CV_ROW_SAMPLE, training_classifications,
Mat(), Mat(), var_type, Mat(), params);
我的问题是如何设置OpenCV随机森林,使其作为回归器工作。我已经搜索了很多,但没有找到答案。最接近的解释是我在这里找到的回答。然而,它仍然没有意义。
我正在寻找一个简单的答案,解释回归的var_type和params设置。
回答:
要将其用于回归,您只需将var_type设置为CV_VAR_ORDERED,即
var_type.at<uchar>(ATTRIBUTES_PER_SAMPLE, 0) = CV_VAR_ORDERED;
并且您可能希望将回归精度设置为一个非常小的数字,如0.0001f。