我已经学习了几周的图像处理和机器学习课程。每天我都在学习关于图像处理的新知识,以及如何训练系统识别图像中的模式。我的问题是,为了成功进行图像识别,需要遵循哪些步骤,例如去噪、使用LDA、PCA,然后使用神经网络。我不是在寻找任何算法,只需要从捕获图像到测试输入图像相似性的简要步骤概述(5-6步)。
P.S# 致管理员们,在标记此问题为非建设性之前,我知道它不具建设性,但我不知道该将其放在哪个网站上。所以请引导我到Stack Exchange的相应网站。
谢谢。
回答:
我将流程描述如下,我省略了许多项目符号。
- 获取带有真实标签的图像。
- 亚马逊M-turk
- 来自Flickr的图像和标签
- 计算图像的特征
- 直接将图像拉伸成列向量
- 使用更复杂的特征,如词袋、LBP。
- 如果需要,后处理特征以减少噪声的影响
- 稀疏编码
- 最大池化
- 白化
- 根据(特征,标签)对训练分类器/回归器
- SVM
- 提升方法
- 神经网络
- 随机森林
- 谱聚类
- 启发式方法…
- 使用训练好的模型识别未见过的图像,并用一些指标评估结果。
顺便说一句,传统上,我们会使用降维方法如PCA来使问题可处理,但最近的研究似乎对此并不在意。