我在C++端使用libtorch 1.4尝试对一个4类分类项目进行预测。然而,与Python端相比,我无法获得相同的预测结果。首先,我在预测前获得了相同的输入张量值。当我比较输出张量值时,我注意到它们是不同的。你可以在图片中找到这些值:
左侧包括Python的输出张量值和每个输入图片的预测结果。
右侧包括C++的输出张量值和每个输入图片的预测结果。
你能提供一个解决方案来获得相同的输出张量值和预测结果吗?
回答:
我注意到我使用了opencv函数来应用归一化,代码如下:
subtract(image, Scalar(0.485, 0.456, 0.406), temp);divide(temp, Scalar(0.229, 0.224, 0.225), image);
这个操作只改变了第一个通道,而没有改变其他通道。因此,实际上,输入张量值是不同的。我直接在张量值上应用了归一化,编写了以下代码:
tensor_image = tensor_image.permute({ 2,0,1 });//chwtensor_image = tensor_image.toType(torch::kFloat);tensor_image = tensor_image.div(255.0);//normalizetensor_image[0] = tensor_image[0].sub_(0.485).div_(0.229);tensor_image[1] = tensor_image[1].sub_(0.456).div_(0.224);tensor_image[2] = tensor_image[2].sub_(0.406).div_(0.225);
这样,我获得了与Python端相同的输入张量值。预测后,我获得了相同的输出张量值。我的问题解决了。