speech-recognition – 学技术

IT技术

如何使用新数据集进行预测？

xiaolong · 2025年5月31日 · 0 Comment

我已经创建了一个模型来从语音样本中预测情感，该模型是根…

IT技术

LibriSpeech数据集的dev-clean文件夹

xiaolong · 2025年5月28日 · 0 Comment

我正在研究LibriSpeech的Dev-Clean数…

IT技术

如何训练一个Tf.js音频识别模型来识别超过3个命令？

xiaolong · 2025年5月28日 · 0 Comment

我一直在按照Tensorflow.js的音频识别教程进…

IT技术

语音识别中的置信度得分是什么意思？

xiaolong · 2025年5月27日 · 0 Comment

许多语音转文本服务（例如谷歌的服务）提供了置信度得分。…

IT技术

使用OpenVINO进行语音识别

xiaolong · 2025年5月26日 · 0 Comment

我想实现一个Python项目，输入是一个.mp4文件，…

IT技术

在使用sidekit进行UBM说话人适应时遇到错误

xiaolong · 2025年5月24日 · 0 Comment

我已经训练了一个UBM模型，现在正在尝试实现说话人适应…

IT技术

什么是N-grams？

xiaolong · 2025年5月24日 · 0 Comment

什么是N-grams？我想为句子 – &…

IT技术

Python Speech Recognizer TypeError: ‘>’ 不支持在 ‘float’ 和 ‘NoneType’ 实例之间进行比较

xiaolong · 2025年5月22日 · 0 Comment

我在Python 3.6中使用了包含隐马尔可夫模型（H…

IT技术

如何学习和创建语音识别系统？

xiaolong · 2025年4月16日 · 0 Comment

我想为旁遮普语创建一个语音识别系统，作为我的个人项目，…

IT技术

在执行 alizeSystem.createSpeakerModel(userName); 时崩溃并显示“UBM not found”

xiaolong · 2025年4月15日 · 0 Comment

我在开发一个使用android-alize的说话人识别…

IT技术

用于语音情感识别（SER）的隐马尔可夫模型与深度学习

xiaolong · 2025年4月15日 · 0 Comment

在构建语音情感检测与识别系统时，哪种方法会更好？是使用…

IT技术

Webkit中的语音转文本功能中断

xiaolong · 2025年4月12日 · 0 Comment

我创建了一个表格，问题会自动填充，答案通过语音捕获。我…

IT技术

语音识别是否需要MFCC特征

xiaolong · 2025年4月11日 · 0 Comment

我目前正在开发一个语音识别项目，并试图选择最有意义的特…

IT技术

使用GMM分类器每次运行结果不同

xiaolong · 2025年4月10日 · 0 Comment

我目前正在进行一个语音识别和机器学习相关的项目。我有两…

IT技术

声音识别中的异常检测方法？

xiaolong · 2025年4月8日 · 0 Comment

存在用于识别两类声音的模型，即A类和B类。如何将C类…

IT技术

如何训练Python的SpeechRecognition 2.1.1库

xiaolong · 2025年4月7日 · 0 Comment

我刚开始学习语音识别，想了解一下训练Python的Sp…

IT技术

使用MATLAB神经网络工具箱对超大数据集进行批量训练

xiaolong · 2025年4月7日 · 0 Comment

我想使用MATLAB神经网络工具箱对KTH数据集进行语…

IT技术

如何使用机器学习从音频片段中提取人声？

xiaolong · 2025年4月7日 · 0 Comment

我们如何使用机器学习从一个可能在整个频域内包含大量噪声…

IT技术

GMM中的负概率

xiaolong · 2025年4月7日 · 0 Comment

我很困惑。我按照以下MATLAB代码测试了一个程序: …

IT技术

使用高斯混合模型进行二元分类

xiaolong · 2025年4月7日 · 0 Comment

我想实现决策边界的公式T=Log( f ( x | c…

IT技术

现有研究中是否有能够区分不同人声音的语音识别技术？

xiaolong · 2025年4月7日 · 0 Comment

已关闭。此问题不符合主题。目前不接受回答。想要改进…

IT技术

如何解码语音输入

xiaolong · 2025年4月7日 · 0 Comment

我想创建一个API，将人类语音转换为国际音标（IPA）…

IT技术

如何在OpenAI的Whisper ASR中获取词级时间戳？

xiaolong · 2025年4月5日 · 0 Comment

我使用OpenAI的Whisper Python库进行…

IT技术

如何在我的训练数据上微调OpenAI的Whisper ASR模型？

xiaolong · 2025年4月5日 · 0 Comment

我使用OpenAI的Whisper Python库进行…

IT技术

### 无法在我的语音识别代码中生成来自谷歌/YouTube的搜索结果

xiaolong · 2025年4月5日 · 0 Comment

我正在尝试构建一个可以与人互动并帮助他们快速获取更新的…