我想设计一个神经网络,训练后能够接受.mp3文件作为输入,然后根据训练结果,在1到10的范围内判断音乐的好坏。但为此,我需要将音频文件转换为波长、频率、振幅以及定义音乐所需的所有其他参数的数组,然后将这些数组作为神经网络的输入。我应该如何解决这个问题?
回答:
如果你将.mp3文件转换为.wav文件,你可以这样做:
from scipy.io import wavfile as wavfrom scipy.fftpack import fftimport numpy as nprate, data = wav.read('music.wav')fft_out = fft(data)
来自 http://www.dummies.com/programming/python/performing-a-fast-fourier-transform-fft-on-a-sound-file/