假设我有一张购物中心的账单图片,我想找出我购买物品的商店名称以及所有购买的物品。那么,如何通过图像处理和机器学习来实现呢?
回答:
步骤1:分离文字和背景。1-1:使用阈值、滤波等方法。1-2:卷积神经网络(如Fastest RCNN)在这方面也很有效。步骤2:提取文字的位置和宽高。如果需要对齐或其他处理,也可以进行。步骤3:分类文字。3-1:从文字图像中提取特征,或者使用深度学习模型自动提取深度特征。3-2:需要使用市场名称和产品名称数据来训练分类器。3-3:基于树的分类器或支持向量机(SVM)适合此问题,因为账单上的分类标准多样化。