我有一个手语数据集。这个数据集被存储在子目录中,如下所示。这是因为对于同一个标签生成了不同的数据。
这个文件夹在.csv文件中被标注,包含’Sentence’和’视频路径’两列,其中图像是视频数据集的帧。
每个视频数据集的帧被存储为.jpg文件。目录结构如下:
||---- ALL THE ABOVE --|--- 1 --- filename1.jpg| | --- filename2.jpg | |----2 --- filename1.jpg| --- filename2.jpg |---- ALL IS WELL -----|----1 --- filename1.jpg| | --- filename2.jpg| |----2 --- filename1.jpg| --- filename2.jpg
总共有101个文件夹,标签有22个。
但问题是,如何使用TensorFlow递归地将图像导入模型,并将这个数据文件夹分割成训练数据集和测试数据集,我需要从目录中导入每一帧。第二个问题(如果这个问题很傻请原谅,但我需要知道),如何将这个.csv文件(其中包含其标签和文件路径)用于模型?
如果有人能解答我的疑问和困惑,我将不胜感激。如果有任何语法错误,请原谅我。
谢谢大家
回答:
我建议使用以下函数 tf.keras.utils.image_dataset_from_directory。您可以选择是否推断标签。