我在尝试使用一些音乐聚类算法进行实验,我认为使用一个主要由离散化的快速傅里叶变换(FFT)组成的特征向量(比如将频率离散化)作为相似性度量会是一个不错的选择。这是否有用?大家知道哪些好的音频相似性度量方法吗?
回答:
首先,你需要决定你是想要指纹识别(即除了某些失真之外的身份识别)还是相似性(但不是身份识别!)度量。
另外,你可以看看MFCC、巴克尺度等相关内容。这方面有很多文献。你可以去亚马逊,找一本专门讨论这个话题的书。
我在尝试使用一些音乐聚类算法进行实验,我认为使用一个主要由离散化的快速傅里叶变换(FFT)组成的特征向量(比如将频率离散化)作为相似性度量会是一个不错的选择。这是否有用?大家知道哪些好的音频相似性度量方法吗?
回答:
首先,你需要决定你是想要指纹识别(即除了某些失真之外的身份识别)还是相似性(但不是身份识别!)度量。
另外,你可以看看MFCC、巴克尺度等相关内容。这方面有很多文献。你可以去亚马逊,找一本专门讨论这个话题的书。