我的数据集有366个文件夹,意味着每个文件夹代表一年中的一天,每个文件夹包含51到55张图片,我只需要其中的36张图片来构建神经网络。所以我可以为这些图片分配一些索引,然后根据它们的索引进行选择吗?有人能建议我相关的代码吗?
回答:
列表中的每个元素都有自己的编号/索引 – 所以首先你可以创建包含所有文件名的列表。
你可以使用 os.listdir()
来获取所有文件夹,然后对每个文件夹使用 os.listdir(folder)
来获取文件夹中的文件名列表。
这样你就有了包含所有文件名(带完整路径)的二维列表,你可以从中选择文件。
某一天的前36张图片
selected = all_filenames[day_index][:36]
每一天的前36张图片
selected = []for day in all_filenames: selected.append( day[:36] )
每一天的随机36张图片