我正在探索Whisper API的功能,想知道它是否可以用来生成带有转录内容的.SRT文件。据我了解,使用Whisper包在本地运行模型时,可以实现这种从转录到.SRT的转换。不幸的是,我没有足够的计算资源在本地运行模型,所以我倾向于直接使用API。
有没有人有这方面的经验,或者能提供通过API实现的指导?
以下Python脚本可以作为起点,但问题是关于模型本身的功能,而不是特定编程语言的实现。
import osimport openaiopenai.api_key = API_KEYaudio_file = open("audio.mp3", "rb")transcript = openai.Audio.transcribe("whisper-1", audio_file)print(transcript.text)
回答:
初步查看OpenAI的文档显示,srt
是/v1/audio/transcriptions
端点的response_format
参数支持的值之一。
在你示例中使用的官方Python绑定中,你应该能够将此作为命名参数传递给openai.Audio.transcribe()
调用:
transcript = openai.Audio.transcribe("whisper-1", audio_file, response_format="srt")