Home IT技术如何在我的训练数据上微调OpenAI的Whisper ASR模型？

如何在我的训练数据上微调OpenAI的Whisper ASR模型？

IT技术 xiaolong · 2025年4月5日 · 0 Comment

我使用OpenAI的Whisper Python库进行语音识别。我有一些训练数据：要么是纯文本，要么是音频及其对应的转录。我如何在自己的训练数据上微调OpenAI的Whisper ASR模型？

回答：

根据https://github.com/openai/whisper/discussions/64，发布的代码中不包含训练/微调部分。因此，要在自己的训练数据上训练/微调OpenAI的Whisper ASR模型，需要自己编写相关代码。

此外，根据https://openai.com/blog/whisper/：

我们正在开源模型和推理代码，作为构建有用应用和进一步研究鲁棒语音处理的基础。

没有提到训练代码。

@某人和@某人指出了以下由第三方开发者创建的微调代码：

fine-tuning openai-api openai-whisper python speech-recognition

发表回复取消回复