C++ API for “Text To Speech” and “Voice to Text”

我想知道是否有适合C++的“语音识别”和“文本转语音”的好API。我已经查看了Festival,它的声音非常真实,以至于你甚至无法分辨是否是电脑在说话,还有voce

遗憾的是,Festival似乎不支持语音识别(我指的是“语音转文本”),而voce是用Java编写的,在C++中使用JNI会很混乱。

所需的API应该同时支持“文本转语音”和“语音转文本”,并且应该有一套好的示例,至少在所有者的网站之外也有。最好能有识别给定声音集的功能,但这是可选的,所以不用担心。

我打算使用这个API来处理一组语音命令,让机器人设备向左、向右等转动。同时,它还会对我说话,说“早上好”、“晚安”等。这些词语将在程序中编码。

请帮助我找到一个适合此目的的C++语音API。如果您有访问教程/安装教程的权限,请友善地与我分享。


回答:

如果你在Windows上开发,可以使用MS Speech API,它允许你进行语音识别(ASR)和文本转语音(TTS)。
你可以在这个页面找到一些示例,以及在这个帖子中找到一个非常基本的语音识别示例。

Related Posts

Keras Dense层输入未被展平

这是我的测试代码: from keras import…

无法将分类变量输入随机森林

我有10个分类变量和3个数值变量。我在分割后直接将它们…

如何在Keras中对每个输出应用Sigmoid函数?

这是我代码的一部分。 model = Sequenti…

如何选择类概率的最佳阈值?

我的神经网络输出是一个用于多标签分类的预测类概率表: …

在Keras中使用深度学习得到不同的结果

我按照一个教程使用Keras中的深度神经网络进行文本分…

‘MatMul’操作的输入’b’类型为float32,与参数’a’的类型float64不匹配

我写了一个简单的TensorFlow代码,但不断遇到T…

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注