C++ API for “Text To Speech” and “Voice to Text”

我想知道是否有适合C++的“语音识别”和“文本转语音”的好API。我已经查看了Festival,它的声音非常真实,以至于你甚至无法分辨是否是电脑在说话,还有voce

遗憾的是,Festival似乎不支持语音识别(我指的是“语音转文本”),而voce是用Java编写的,在C++中使用JNI会很混乱。

所需的API应该同时支持“文本转语音”和“语音转文本”,并且应该有一套好的示例,至少在所有者的网站之外也有。最好能有识别给定声音集的功能,但这是可选的,所以不用担心。

我打算使用这个API来处理一组语音命令,让机器人设备向左、向右等转动。同时,它还会对我说话,说“早上好”、“晚安”等。这些词语将在程序中编码。

请帮助我找到一个适合此目的的C++语音API。如果您有访问教程/安装教程的权限,请友善地与我分享。


回答:

如果你在Windows上开发,可以使用MS Speech API,它允许你进行语音识别(ASR)和文本转语音(TTS)。
你可以在这个页面找到一些示例,以及在这个帖子中找到一个非常基本的语音识别示例。

Related Posts

使用LSTM在Python中预测未来值

这段代码可以预测指定股票的当前日期之前的值,但不能预测…

如何在gensim的word2vec模型中查找双词组的相似性

我有一个word2vec模型,假设我使用的是googl…

dask_xgboost.predict 可以工作但无法显示 – 数据必须是一维的

我试图使用 XGBoost 创建模型。 看起来我成功地…

ML Tuning – Cross Validation in Spark

我在https://spark.apache.org/…

如何在React JS中使用fetch从REST API获取预测

我正在开发一个应用程序,其中Flask REST AP…

如何分析ML.NET中多类分类预测得分数组?

我在ML.NET中创建了一个多类分类项目。该项目可以对…

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注