我熟悉用于文本分类的监督学习方法(支持向量机、最大熵、贝叶斯分类器),但对于图像分类,我不知道该从哪里开始。
我有一组女性图像,需要将她们分类为美丽或不美丽。我面临的第一个障碍是“特征选择”。我考虑使用头发形状、肤色、眼睛形状作为特征,但这些特征的检测变得过于复杂。相比之下,OCR似乎相对更容易,因为可以将形状转换为黑白格式,并与已知符号找到最佳匹配。
如果无监督学习方法更有用,我也很愿意探索。请提供一些指导,告诉我该如何开始。任何免费使用的库都会非常有帮助(可以是任何编程语言)!
回答:
如果你想分类美丽与不美丽,你应该使用监督学习,因为无监督学习对“美丽”这一概念一无所知,你必须通过标签引入这一概念。
作为一个起点的指导,ECCV 2010 上有一篇关于面部美丽的近期论文(你可以在 http://dgray.info/ 找到),在引言部分有许多其他论文的参考文献。