如何使用新数据集进行预测?

我已经创建了一个模型来从语音样本中预测情感,该模型是根…

LibriSpeech数据集的dev-clean文件夹

我正在研究LibriSpeech的Dev-Clean数…

如何训练一个Tf.js音频识别模型来识别超过3个命令?

我一直在按照Tensorflow.js的音频识别教程进…

语音识别中的置信度得分是什么意思?

许多语音转文本服务(例如谷歌的服务)提供了置信度得分。…

使用OpenVINO进行语音识别

我想实现一个Python项目,输入是一个.mp4文件,…

在使用sidekit进行UBM说话人适应时遇到错误

我已经训练了一个UBM模型,现在正在尝试实现说话人适应…

什么是N-grams?

什么是N-grams? 我想为句子 – &…

Python Speech Recognizer TypeError: ‘>’ 不支持在 ‘float’ 和 ‘NoneType’ 实例之间进行比较

我在Python 3.6中使用了包含隐马尔可夫模型(H…

如何学习和创建语音识别系统?

我想为旁遮普语创建一个语音识别系统,作为我的个人项目,…

在执行 alizeSystem.createSpeakerModel(userName); 时崩溃并显示“UBM not found”

我在开发一个使用android-alize的说话人识别…

用于语音情感识别(SER)的隐马尔可夫模型与深度学习

在构建语音情感检测与识别系统时,哪种方法会更好?是使用…

Webkit中的语音转文本功能中断

我创建了一个表格,问题会自动填充,答案通过语音捕获。我…

语音识别是否需要MFCC特征

我目前正在开发一个语音识别项目,并试图选择最有意义的特…

使用GMM分类器每次运行结果不同

我目前正在进行一个语音识别和机器学习相关的项目。我有两…

声音识别中的异常检测方法?

存在用于识别两类声音的模型,即A类和B类。 如何将C类…

如何训练Python的SpeechRecognition 2.1.1库

我刚开始学习语音识别,想了解一下训练Python的Sp…

使用MATLAB神经网络工具箱对超大数据集进行批量训练

我想使用MATLAB神经网络工具箱对KTH数据集进行语…

如何使用机器学习从音频片段中提取人声?

我们如何使用机器学习从一个可能在整个频域内包含大量噪声…

GMM中的负概率

我很困惑。我按照以下MATLAB代码测试了一个程序: …

使用高斯混合模型进行二元分类

我想实现决策边界的公式T=Log( f ( x | c…

现有研究中是否有能够区分不同人声音的语音识别技术?

已关闭。 此问题不符合主题。目前不接受回答。 想要改进…

如何解码语音输入

我想创建一个API,将人类语音转换为国际音标(IPA)…

如何在OpenAI的Whisper ASR中获取词级时间戳?

我使用OpenAI的Whisper Python库进行…

如何在我的训练数据上微调OpenAI的Whisper ASR模型?

我使用OpenAI的Whisper Python库进行…

### 无法在我的语音识别代码中生成来自谷歌/YouTube的搜索结果

我正在尝试构建一个可以与人互动并帮助他们快速获取更新的…