OpenCV Python 为 VGG16 模型进行图像预处理

我想正确地预处理图像,以便输入到 VGG16 模型中

在他们的原始论文中,作者写道:

在训练过程中,我们的卷积神经网络的输入是固定尺寸的 224 × 224 RGB 图像。我们唯一做的预处理是从每个像素中减去训练集上计算的平均 RGB 值。

调整大小部分很容易完成:

… 但我对减去平均 RGB 值不太确定:

meanRBB_substract_image = resized_image - np.mean(resized_image)

这是正确的做法吗?

减去平均 RGB 值之前:

enter image description here

减去平均 RGB 值之后:

enter image description here

关于 VGG16 模型的更多信息: https://neurohive.io/en/popular-networks/vgg16/#:~:text=The%20architecture%20depicted%20below%20is%20VGG16.&text=The%20input%20to%20cov1%20layer,stack%20of%20convolutional%20(conv.)

编辑: 我刚刚意识到他们写的是“在训练集上计算” -> 这是否意味着我需要 1. 找到训练集中所有图片的平均 RGB 值,然后 2. 从所有训练集图像中减去这个平均值?


回答:

尝试:

from keras.applications.vgg16 import preprocess_input...resized_image = cv2.resize(image, dim, interpolation = cv2.INTER_AREA)processedimage = preprocess_input(resized_image)

来自:https://www.pyimagesearch.com/2016/08/10/imagenet-classification-with-python-and-keras/

Related Posts

使用LSTM在Python中预测未来值

这段代码可以预测指定股票的当前日期之前的值,但不能预测…

如何在gensim的word2vec模型中查找双词组的相似性

我有一个word2vec模型,假设我使用的是googl…

dask_xgboost.predict 可以工作但无法显示 – 数据必须是一维的

我试图使用 XGBoost 创建模型。 看起来我成功地…

ML Tuning – Cross Validation in Spark

我在https://spark.apache.org/…

如何在React JS中使用fetch从REST API获取预测

我正在开发一个应用程序,其中Flask REST AP…

如何分析ML.NET中多类分类预测得分数组?

我在ML.NET中创建了一个多类分类项目。该项目可以对…

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注