我有一组照片,我想区分出相似照片的聚类。我应该使用哪些图像特征和算法来解决我的任务?
回答:
这个问题太宽泛了。
一般来说,你可以使用任何聚类机制,例如流行的k-means算法。为了准备你的数据进行聚类,你需要将你的集合转换成一个数组X,其中每一行是一个示例(图像),每一列是一个特征。
主要的问题是——你的特征应该是什么。这很难回答,因为不知道你试图实现什么。如果你的图像很小且尺寸相同,你可以简单地将每个像素作为一个特征。如果你有任何元数据并且想使用它进行分类,你可以将元数据中的每个标签作为一个特征。
现在,如果你真的需要在图像之间找到一些模式,你将不得不应用额外的处理层,比如卷积神经网络,这本质上允许你从图像的不同部分提取特征。你可以把它想象成一个过滤器,它会将每张图像转换成,比如说8×8的矩阵,然后相应地可以作为数组X中具有64个不同特征的一行,用于聚类。