我正在根据这个链接对AlexNet进行微调以进行人脸检测。
与链接中的唯一不同之处在于,我使用了另一个数据集(facescrub和来自imagenet的一些图像作为负样本)。
我注意到准确度增长得太快了,在50次迭代中从0.308增长到0.967,当达到约0.999时,我停止训练,并使用与上述链接相同的Python脚本使用该模型。
我用数据集中的一张图像进行测试,结果远不及预期,测试图像结果。如您所见,人脸框太大(而数据集图像是紧密裁剪的),更不用说框内没有包含人脸了。
我的solver和train_val文件完全相同,唯一的区别是批量大小和最大迭代次数。
回答:
原因是我的数据集中人脸样本远多于非人脸样本。我尝试了相同设置但正负样本数量相同的情况,现在准确度增长得更慢了。