我正在尝试构建一个管道,能够根据图像预测物体的大小,例如根据苹果的照片预测其大小,单位为X。
据我所知,目前还没有包含校准物体的训练集与之共同训练;我的实际问题是要从食物组中提取营养信息(粗略来说),一旦我知道食物的宽度和高度或边界框的面积,我就能准确计算卡路里所需的所有信息。
如上所述,目前我知道的唯一方法是使用校准物体训练分类器;因此,可以在这里拍摄图像,并将它们归类到你正在校准的物体类别中,例如一角硬币、便士、信用卡等,这些都是尺寸固定的物体。
让我有点困惑的是是否有更好的方法,如果有,请分享。此外,如果有使用静态物体校准过的预训练模型,可以用来估计给定任何图像中物体的大小,请告知。
回答:
根据你问题的定义,我认为你不应该训练分类器来预测物体的大小。你可能需要训练一个神经网络来识别一些常见物体(如一角硬币、便士、信用卡等),并训练另一个网络来识别食物。一旦你在盘子附近放置“校准”物体,你就可以轻松地对图像进行归一化并计算食物的尺寸。