如何学习和创建语音识别系统?

我想为旁遮普语创建一个语音识别系统,作为我的个人项目,…

在执行 alizeSystem.createSpeakerModel(userName); 时崩溃并显示“UBM not found”

我在开发一个使用android-alize的说话人识别…

用于语音情感识别(SER)的隐马尔可夫模型与深度学习

在构建语音情感检测与识别系统时,哪种方法会更好?是使用…

Webkit中的语音转文本功能中断

我创建了一个表格,问题会自动填充,答案通过语音捕获。我…

语音识别是否需要MFCC特征

我目前正在开发一个语音识别项目,并试图选择最有意义的特…

使用GMM分类器每次运行结果不同

我目前正在进行一个语音识别和机器学习相关的项目。我有两…

声音识别中的异常检测方法?

存在用于识别两类声音的模型,即A类和B类。 如何将C类…

如何训练Python的SpeechRecognition 2.1.1库

我刚开始学习语音识别,想了解一下训练Python的Sp…

使用MATLAB神经网络工具箱对超大数据集进行批量训练

我想使用MATLAB神经网络工具箱对KTH数据集进行语…

如何使用机器学习从音频片段中提取人声?

我们如何使用机器学习从一个可能在整个频域内包含大量噪声…

GMM中的负概率

我很困惑。我按照以下MATLAB代码测试了一个程序: …

使用高斯混合模型进行二元分类

我想实现决策边界的公式T=Log( f ( x | c…

现有研究中是否有能够区分不同人声音的语音识别技术?

已关闭。 此问题不符合主题。目前不接受回答。 想要改进…

如何解码语音输入

我想创建一个API,将人类语音转换为国际音标(IPA)…

如何在OpenAI的Whisper ASR中获取词级时间戳?

我使用OpenAI的Whisper Python库进行…

如何在我的训练数据上微调OpenAI的Whisper ASR模型?

我使用OpenAI的Whisper Python库进行…

### 无法在我的语音识别代码中生成来自谷歌/YouTube的搜索结果

我正在尝试构建一个可以与人互动并帮助他们快速获取更新的…

Python 文本到语音和语音识别同时进行

已关闭。此问题需要更加聚焦。目前不接受回答。 想要改进…

我在用Python开发一个虚拟助手,但不知道为什么语音识别不工作,也无法打印出我说的话

正如我所说,我正在用Python开发一个虚拟助手,但语…

作为人工智能初学者,我应该选择语音表情AI项目还是面部表情AI项目?

已关闭。此问题属于基于意见的问题。目前不接受回答。 想…

如何修复 “TypeError: listen() missing 1 required positional argument: ‘source'” 错误?

在构建语音识别平台时,我遇到了以下问题:TypeErr…

如何修复AttributeError: ‘NoneType’ object has no attribute ‘lower’?

每次我运行旨在构建弱人工智能平台的代码时,都会收到一个…

Google云存储WAV文件上传 – “404 请求的实体未找到”

我的代码参考了谷歌网站上粘贴的代码: https://…

可以使用神经网络对i-vectors进行语言识别分类吗?

我在做一个语言识别器,原本计划使用神经网络对我的i-v…

Dialogflow无法识别训练短语中的名字

不知为何,Dialogflow无法识别训练短语中存在的…