我目前正在使用 RCNN 算法开发一个面部检测应用程序。代码使用的是 dlib-19.2 C++ 开发的。我的操作系统是 Windows 10 家庭版。使用的框架是 Qt 5.7。
我的781张图像(高度:228,宽度:307)存放在一个名为 “images” 的向量中
std::vector<matrix<rgb_pixel>> images;
之后,我将 “images” 分成两个向量:一个包含训练图像(共389张),另一个包含测试图像(共391张):
std::vector<dlib::matrix<dlib::rgb_pixel>> training_images(images.begin(), images.begin() + half_size);std::vector<dlib::matrix<dlib::rgb_pixel>> testing_images(images.begin() + half_size, images.end());
然后,我尝试使用 train() 函数训练 RCNN 网络:
template <long num_filters, typename SUBNET> using con5d = con<num_filters,5,5,2,2,SUBNET>;template <long num_filters, typename SUBNET> using con3 = con<num_filters,3,3,1,1,SUBNET>;template <typename SUBNET> using downsampler = relu<bn_con<con5d<32, relu<bn_con<con5d<32, relu<bn_con<con5d<32,SUBNET>>>>>>>>;template <typename SUBNET> using rcon3 = relu<bn_con<con3<32,SUBNET>>>;using net_type = loss_binary_log<con<1,6,6,1,1,rcon3<rcon3<rcon3<downsampler<input_rgb_image_pyramid<pyramid_down<6>>>>>>>>;net_type net;dnn_trainer<net_type> trainer(net);trainer.set_learning_rate(0.01);trainer.set_min_learning_rate(0.00001);trainer.set_mini_batch_size(5);trainer.be_verbose();trainer.train(training_images, training_labels);
然而,这不起作用。每当我运行代码时,都会出现以下错误:
在第179行检测到错误。在文件 ../../Desktop/dlib-19.2/dlib/dnn/loss.h 中检测到错误。在函数 double dlib::loss_binary_log_::compute_loss_value_and_gradient(const dlib::tensor&, const_label_iterator, SUBNET&) const [with const_label_iterator = __gnu_cxx::__normal_iterator >; SUBNET = dlib::dimpl::subnet_wrapper, dlib::add_layer, dlib::add_layer, dlib::add_layer, dlib::add_layer, dlib::add_layer, dlib::add_layer, dlib::add_layer, dlib::add_layer, dlib::add_layer, dlib::add_layer, dlib::add_layer, dlib::add_layer, dlib::input_rgb_image_pyramid >, void>, void>, void>, void>, void>, void>, void>, void>, void>, void>, void>, void>, void>, void>, void>, void>, void>, void>, void>, true, void>] 中检测到错误。
失败的表达式是 output_tensor.nr() == 1 && output_tensor.nc() == 1 && output_tensor.k() == 1。
我实在不知道发生了什么。你能帮帮我吗?
非常感谢您的所有回答。
回答:
错误提示您选择的 loss_binary_log 损失函数要求网络的输出张量每样本只包含一个值。但您定义的网络并未这样做。在网络末尾添加一个全连接层或进行类似操作,以便在末尾得到一个输出值。