神经网络已成功用于监督学习来分类图像。
我目前正在研究一个不同的问题:区分显示某些内容的图像,这些图像包含某种明显的秩序,与仅仅是白噪声的图像。我希望能得到一个关于图像有序程度的数值估计。
显然,有几种方法可以做到这一点,例如,PNG压缩图像并查看它缩小了多少。(纯噪声是不可压缩的。)但我目前对尝试用神经网络来做这件事感兴趣;在我看来,应该可以使用某种自动编码器通过无监督学习来实现这一点。
这是已经做过的事情吗?理想情况下使用PyTorch,但如果有任何语言和框架的解决方案,我都会乐意查看。
回答:
这个问题对于stackoverflow来说有点太宽泛了,似乎更像是一个研究问题。这个话题在https://stats.stackexchange.com/上会更合适,那里有机器学习方面的人员出没。
尽管如此,这是一个有趣的问题。根据我的经验,如果可能的话,采用分析解决方案总是比试图学习解决方案更好,我将机器学习视为在事情变得过于复杂时可以依靠的东西。检测纯噪声图像相对简单,人们会期望图像的香农熵会激增。你还可以例如将图像直方图的K-L散度与高斯分布或泊松分布或任何你预期的噪声分布进行匹配。如果这些图像真的只是噪声,那么我期望这些解决方案中的任何一个都能非常容易且快速地对它们进行分类,并且几乎不需要调整。如果你想学习答案,我建议你制作一些基于信息论或简单边缘的特征,并使用Naive Bayes或SVM等进行分类。
如果你想使用神经网络,当然可以,我相信你能教会模型理解信息内容的概念。深度图像先验是一篇最近流行的文章,它使用了自动编码器对结构化图像具有较低“阻抗”的想法。他们用它来去噪、填补和进行超分辨率,但我相信你可以通过遵循相同的思路制作一个基于无监督或半监督的神经网络的无意义检测器。我期望这会比使用类似准确度或更差的简单手工信息论方法慢几个数量级。