我之前只用过.csv格式进行机器学习。我也处理过图像格式,但仅限于预制的图像集(如MNIST等)。如果我要从头开始创建一个图像集,类标签通常是如何格式化的?我是否需要手动为jpeg图像命名标题?
祝好,@某某
回答:
我处理过的图像数据集格式如下:
- 类名作为文件夹:顾名思义,属于特定类的图像被放入以类名命名的特定文件夹中。
例如,用于区分猫和狗的数据集
-Dataset/--Cats/---这里放所有猫的图片--Dogs/---这里放所有狗的图片
- 单一文件夹 + 文本文件:所有图像都被放入一个文件夹中——显然每个图像文件都有一个独特的名称。可以将
图像名称 : 类别
的键值对存储在csv文件的行中。
例如
-Dataset/--这里放所有图片e--imagename_class.csv
- 单一文件夹,文件名中包含类别:所有图像可以放入一个文件夹中,图像名称中包含类别标签和某个变化的索引值。
例如
-Dataset/--cat_1.jpg--cat_2.jpg--dog_1.jpg--cat_3.jpg--...
希望这些对你有帮助!