我想知道是否有适合C++的“语音识别”和“文本转语音”的好API。我已经查看了Festival,它的声音非常真实,以至于你甚至无法分辨是否是电脑在说话,还有voce。
遗憾的是,Festival
似乎不支持语音识别(我指的是“语音转文本”),而voce
是用Java编写的,在C++中使用JNI会很混乱。
所需的API应该同时支持“文本转语音”和“语音转文本”,并且应该有一套好的示例,至少在所有者的网站之外也有。最好能有识别给定声音集的功能,但这是可选的,所以不用担心。
我打算使用这个API来处理一组语音命令,让机器人设备向左、向右等转动。同时,它还会对我说话,说“早上好”、“晚安”等。这些词语将在程序中编码。
请帮助我找到一个适合此目的的C++语音API。如果您有访问教程/安装教程的权限,请友善地与我分享。
回答:
如果你在Windows上开发,可以使用MS Speech API,它允许你进行语音识别(ASR)和文本转语音(TTS)。
你可以在这个页面找到一些示例,以及在这个帖子中找到一个非常基本的语音识别示例。