假设我有一个训练文件夹。这个训练文件夹包含多个单独的文件夹,每个文件夹里有图像(CNV、DME、DRUSEN 和 NORMAL 都是检测类型):
我想遍历每个文件夹中的每张图像,并为每张图像分配一个
- 唯一ID和疾病名称
然后将这些信息写入一个CSV文件
我希望达到的示例效果如下:
我希望有一个CSV文件,其中一列包含我拥有的60,000张图像的唯一ID,这些图像分布在各个文件夹中,另一列则包含疾病类型(或文件名:CNV、DME、DRUSEN、NORMAL)。
回答:
你可以使用os.listdir()
来实现这个功能。
csv = 'id, disease\n'for disease in os.listdir(root_data_path): for file in os.listdir(os.path.join(root_data_path, disease)): csv += f'{file},{disease}\n'with open('diseases_ids.csv', 'w+') as output_csv: output_csv.write(csv)
我还没有测试过这个代码,但你明白这个思路,对吗?