为什么MinMaxScaler会在图像上添加线条？

我想将图像的每个通道（R、G、B）的像素值归一化到[0, 1]范围内。

最小示例

#!/usr/bin/env pythonimport numpy as npimport scipyfrom sklearn import preprocessingoriginal = scipy.misc.imread('Crocodylus-johnsoni-3.jpg')scipy.misc.imshow(original)transformed = np.zeros(original.shape, dtype=np.float64)scaler = preprocessing.MinMaxScaler()for channel in range(3):    transformed[:, :, channel] = scaler.fit_transform(original[:, :, channel])scipy.misc.imsave("transformed.jpg", transformed)

发生了什么

使用https://commons.wikimedia.org/wiki/File:Crocodylus-johnsoni-3.jpg，我得到了以下“归一化”结果：

如你所见，右侧从上到下出现了线条。那里发生了什么？在我看来，归一化出了问题。如果是这样：我该如何修复它？

回答：

在scikit-learn中，形状为(m, n)的二维数组通常被解释为一组m个样本，每个样本有n个特征。

MinMaxScaler.fit_transform()转换每个特征，所以你的数组的每一列都是独立转换的。这导致了图像中的垂直“条纹”。

看起来你打算独立缩放每个颜色通道。要使用MinMaxScaler实现这一点，请重塑输入，使每个通道成为一列。也就是说，如果原始图像的形状为(m, n, 3)，请将其重塑为(m*n, 3)，然后将其传递给fit_transform()方法，最后恢复结果的形状以创建转换后的数组。

例如，

ascolumns = original.reshape(-1, 3)t = scaler.fit_transform(ascolumns)transformed = t.reshape(original.shape)

这样，transformed看起来像这样：

图像看起来与原始图像完全相同，因为在数组original中，每个通道的最小值和最大值分别为0和255：

In [41]: original.min(axis=(0, 1))Out[41]: array([0, 0, 0], dtype=uint8)In [42]: original.max(axis=(0, 1))Out[42]: array([255, 255, 255], dtype=uint8)

所以在这种情况下，fit_transform所做的只是将所有输入值均匀地转换到浮点范围[0.0, 1.0]。如果某个通道的最小值或最大值不同，转换后的图像看起来会有所不同。

顺便说一下，使用纯numpy执行转换并不难。（我使用的是Python 3，所以在以下代码中，除法会自动将结果转换为浮点数。如果你使用的是Python 2，你需要将其中一个参数转换为浮点数，或者使用from __future__ import division。）

In [58]: omin = original.min(axis=(0, 1), keepdims=True)In [59]: omax = original.max(axis=(0, 1), keepdims=True)In [60]: xformed = (original - omin)/(omax - omin)In [61]: np.allclose(xformed, transformed)Out[61]: True

（这种方法的一个潜在问题是，如果某个通道是常数，它会生成错误，因为omax - omin中的一个值将为0。）

学技术

为什么MinMaxScaler会在图像上添加线条？

最小示例

发生了什么

发表回复取消回复

最小示例

发生了什么

相关文章：

Related Posts

使用LSTM在Python中预测未来值

如何在gensim的word2vec模型中查找双词组的相似性

dask_xgboost.predict 可以工作但无法显示 – 数据必须是一维的

ML Tuning – Cross Validation in Spark

如何在React JS中使用fetch从REST API获取预测

如何分析ML.NET中多类分类预测得分数组？

发表回复 取消回复

发表回复取消回复