在研究这里解释的任何机器学习函数时,它们都遵循cvStatModel的格式。
例如,NormalBayes的训练函数通过以下方式实现:
CvNormalBayesClassifier::train(const Mat& trainData, const Mat& responses, const Mat& varIdx=Mat(), const Mat& sampleIdx=Mat(), bool update=false )
文档建议查看cvStatModel以了解参数的详细信息。
我不理解的是responses
应该接受什么?我知道trainData
是我们用来训练系统的词袋数据,但responses
应该放什么呢?
在词袋的一个示例中,responses
元素的处理如下:
float label=atof(entryPath.filename().c_str());labels.push_back(label);NormalBayesClassifier classifier;classifier.train(trainingData, labels);
所以在这里,图像的文件名被转换为双精度数,并用作responses
元素。
我不理解这一点,并且对此感到困惑。能有人解释一下responses
元素应该接受什么吗?为什么在上面的例子中使用atof
?
回答:
这些模型是监督式机器学习技术,这意味着训练模型不仅需要训练数据(即测量向量),还需要与每个样本相关联的标签(或连续值)。例如,如果你试图检测包含猫的图像,你有一个训练集,比如说,500张不包含猫的图像和500张包含猫的图像。你计算所有1000张图像的描述符,并为每个类别分配一个数字(按照惯例,非猫为-1,猫为1)。然后,responses
将是一个1000×1的整数矩阵,前500个值为-1,其余为1。
在你的例子中,atof
用于将目录名转换为一个独特的数字,代表类别,因为训练示例可能按文件夹排序(例如,猫、狗、自行车等文件夹)。