我使用OpenAI的Whisper Python库进行语音识别。我有一些训练数据:要么是纯文本,要么是音频及其对应的转录。我如何在自己的训练数据上微调OpenAI的Whisper ASR模型?
回答:
根据https://github.com/openai/whisper/discussions/64,发布的代码中不包含训练/微调部分。因此,要在自己的训练数据上训练/微调OpenAI的Whisper ASR模型,需要自己编写相关代码。
此外,根据https://openai.com/blog/whisper/:
我们正在开源模型和推理代码,作为构建有用应用和进一步研究鲁棒语音处理的基础。
没有提到训练代码。