我想创建一个像这个视频中的阀门检测和分类系统:https://www.youtube.com/watch?v=VY92fqmSdfA,以检测阀门的开启、关闭和中间位置。
我已经做了一些研究,找到了几种解决这个问题的办法,但我需要遵守一些条件来解决这个问题:
条件1:在应用中使用机器学习,我不能使用简单的模板匹配方法等。
条件2:使用小型数据库(每类最少10张图片,最多40张图片)。
条件3:当摄像头位置变化时,能够检测阀门的位置,因此我不能仅通过颜色来检测阀门手柄。
我想使用HOG(方向梯度直方图)+ SVM/ANN,但HOG需要大量图像来训练SVM/ANN。
我不知道在遵守这些条件的情况下是否能解决这个问题?
回答:
众所周知,机器学习方法正常运作所需的最重要的东西是数据。因此,我认为你的第1和第2个条件是相互矛盾的。此外,你的第3个条件增加了问题的复杂性。你可以通过包含不同角度和光照条件下的更多数据来解决这个问题。但这又与条件2相冲突。
即便如此,如果你想继续使用机器学习路径,我建议你使用预训练模型、强大的数据增强技术,并且可能使用模型集成来帮助提高检测效果。由于这个问题并不太难,应该会有效。