我已经阅读了几篇教程,这些教程指导如何使用Keras导入图像进行分类。就我所见,所有教程都只是描述了多类别场景(例如,猫/狗类别)。这些方法不适用于我的问题。
我想进行一个回归任务,输入和输出都是图像。我的问题是:如果不是分类而是回归,我该如何轻松地将图像数据传递给Keras?
对于每一对给定的输入和输出训练数据,我无法找到从以下结构轻松导入的方法:
├── input_data│ ├── input0.png| ├── input1.png| └── ...└── output_data ├── output0.png ├── output1.png └── ...
到这个步骤:
x_train, x_valid, y_train, y_valid = train_test_split(inputs, outputs, test_size=0.2, shuffle= True)
我已经尝试过以下方法:
-
Keras的flow_from_directory方法看似非常完美,并且提供了不错的功能,但它仅适用于分类数据,这些数据被整理在子目录中。
-
其次,Tensorflow提供了一个图像导入函数。
from keras.preprocessing.image import img_to_array, load_imgimg = load_img('img.png') x = img_to_array(img)
据我所知,这也非常直接,但它只能打开单个图像而不是整个目录。如果遍历整个目录,这可能会有所帮助,但由于Keras拥有这些不错的预处理功能,我想知道是否有类似Keras的方式。所以我的问题是:
是否有舒适的方法导入大型图像数据集用于回归?
回答:
据我所知,Keras
中没有特定的函数可以加载所有图像作为数据集。然而,您可以通过结合使用os.walk()
和Image.open()
来实现这一点,类似于以下代码可以一次性将所有图像加载到列表中:
import osfrom PIL import Image # 或者您可以使用keras的函数来加载图像def load_dataset(top_dir="input_data"): images_dataset = [] for root, dirs, files in os.walk(top_dir): for name in files: # print(os.path.join(root, name)) img = np.array(Image.open(os.path.join(root, name))) images_dataset.append(img) return images_dataset