图像分类问题的经典例子是使用 softmax 线性回归模型对 MNIST 数据集中的手写数字进行分类。假设我们有一个包含 10 个对象,每个对象有 10 张图像的面部数据库。这将是一个图像(人脸)识别的例子。
因此,考虑到数字和面部的特征空间的差异,通过类比,我可以假设每个对象相当于每个数字,而对象的图像相当于手写数字的示例,并应用分类算法来进行识别吗?查看此链接
请帮助我理解这一点?
回答:
在这种情况下没有区别。只是分类问题中的两个数据集:带有数字标签的手写数字图像,或带有对象标签的面部图像。
然而,通常人脸识别任务涉及在同一张图片中找到所有的人脸,而不是对它们进行标记。