我正在尝试开发一个应用程序,通过训练神经网络来将音乐分类为可能喜欢或可能不喜欢,这些音乐已经由用户标记为喜欢。我之前从未做过音频分析,所以对此几乎一无所知。为了使这个分类模型准确,我需要在我的音乐数据集中包含哪些特征。例如:分贝值、频率值、音频长度
谢谢
回答:
频谱图是一种有用的技术,用于可视化声音频谱的频率及其在非常短的时间内如何变化。你可以使用一种称为梅尔频率倒谱系数(MFCC)的类似技术作为数据集的特征。
你可以使用Librosa的mfcc()函数,该函数从时间序列音频数据生成MFCC,使任务变得更加简单