我正在尝试使用Create ML构建一个对象检测模型。除了检测图片中的对象类型外,我还希望输出中能包含每个检测对象的坐标(或位置)。
如何在输出图片中获取每个检测对象的坐标?
使用Create ML是否可以做到这一点?如果可以,如何实现?
回答:
是的,对象检测器会返回一个VNRecognizedObjectObservation
对象的数组,包含它检测到的内容。每个对象包含匹配标签的数组、置信度值和边界框以及其他信息。
边界框是归一化的,因此在使用之前,您需要使用VNImageRectForNormalizedRect
将其转换为像素坐标。
Apple有一个非常出色的示例应用,并提供了详细的解释,您可以在这里找到。