我有一个YOLO模型用于检测交通标志的位置,还有一个模型用于确定标志的类型。我的问题是如何将YOLO检测到的标志发送到分类器,然后在边界框上方写上正确的标签,就像下图一样
回答:
你可以使用OpenCV来实现这一点。使用readNet
或readNetFrom...
加载预训练模型(weights
、cfg
、caffemodel
、prototxt
、onnx
)。
对于视频,使用OpenCV dnn blobFromImage
将每一帧传递给YOLO网络进行边界框检测。你可能需要进行非最大抑制。根据置信度裁剪边界框,然后再次将裁剪后的图像传递给dnn
VGG网络,这应该会给出分类结果。
要写入标签,获取每个边界框的(x,y)
位置,并使用putText
在原始输入图像帧上以字体大小作为偏移量写入标签。