例如,我想开发一个用于图像分类的深度学习模型,并且我有数千张图像。由于使用整个数据集进行训练需要很长时间,我希望取原始数据集的样本(10%)进行初步训练。如何做到这一点?
回答:
如果数据集包含在一个文件夹中,我将尝试以下方法:
我使用了replace=True以避免两次选取同一个元素。在选取了10%的图像后,我加载它们。
实际上,我不确定这种方法是否是最优的,但它可以作为一个好的起点。
例如,我想开发一个用于图像分类的深度学习模型,并且我有数千张图像。由于使用整个数据集进行训练需要很长时间,我希望取原始数据集的样本(10%)进行初步训练。如何做到这一点?
回答:
如果数据集包含在一个文件夹中,我将尝试以下方法:
我使用了replace=True以避免两次选取同一个元素。在选取了10%的图像后,我加载它们。
实际上,我不确定这种方法是否是最优的,但它可以作为一个好的起点。