我有一千张左右的交易卡,每张卡片上的图片各不相同。我还拥有一个数据库,里面保存了每张曾经印刷过的交易卡的高分辨率扫描图。我希望将这些扫描图像输入到深度学习网络中,这样当我将一张或多张卡片拿到摄像头前时,系统就能识别出我拿的是哪一张(或哪些)卡片。
看起来Jetpac可能是我开始的好地方。我有机器学习的经验,但主要是数值分析,而不是图像处理。到目前为止,我看到的例子都是人们拍摄他们想要识别的物品,然后能够识别出它。但是,我能否直接将一个文件夹中的图像作为训练数据导入呢?
最后,我的目标是在一组联网的树莓派2上实现这个系统,这些设备并行工作。我不确定Jetpac是否明确支持分布式计算,但我想我可以将视频源分成多个源,并将每个源分别输入到在不同树莓派上运行的Jetpac实例中。
我对这个问题的思考方式是否正确?是否有更实用的方法?感谢任何帮助!!
编辑:为了避免我的问题听起来过于宽泛,我的最终问题是Jetpac(或任何其他深度学习库)是否能够接受一组静态图像,并训练识别出视频源中的这些图像实例。
回答:
你可以使用深度学习来完成这个任务,但除非你处理的是一些非常特殊的情况,否则不建议这样做。对于你的任务,你希望在另一张图像中找到特定的图像,而不是像通常的学习任务那样,从一组图像中学习一个抽象的类别(例如狗的外观)。
有很多已知的、快速且准确的图像处理算法可以解决这个问题,这些算法都是基于从原始图像中提取特征,并在未见过的图像中检测特征。你可以在这里看到使用OpenCV的具体实现这里,或者通过阅读关于特征检测的更多信息来深入了解。