在seq2seq模型中添加更多层

在由@人名提供的示例seq2seq代码中,我如何在编码…

如何比较口语录音与参考录音 – 语言学习

我在寻找一种方法,将用户提交的音频录音与参考录音进行比…

Google的Gemini处理本地音频文件

Google 有一个页面描述了如何使用他们的Gemin…

Smoothing Out Streamed Audio from ChatGPT

为了课程需要,我正在尝试从ChatGPT API响应中…

我想了解用于说话人分割的’d-vector’

当将分段的语音音频添加到DNN模型中时,我了解到从最后…

理解mfcc输出

from librosa.feature import…

Discord 接收音频

我想从Discord接收音频以进行语音识别。我在Pyt…

ANN形状用于销售预测

我的ANN的输入(特征)和预期输出如下: 输入1:产品…

如何运行两层感知器来解决异或问题

使用单个感知器和标准标量乘积以及单位阶跃函数无法解决异…

尝试从声波中提取特征用于AI作曲

我计划制作一个AI作曲器,它可以接收一种乐器的多首歌曲…

算法建议:比较声音片段

(不确定这里是否是提问的正确地方) 我们正在分析数千个…

如何从图像(jpg、png等)中提取图层

假设我们有一张CakePHP的标志图片,如何将其转换回…

AMR 中的静音检测

如何在 AMR 中区分静音和其他音频? 我想实现自定义…

识别语音为男性或女性

我对音频工程不太了解,请见谅。我收到一个音频文件作为输…

识别(音乐)乐谱的方法

已关闭。这个问题需要更加聚焦。目前不接受回答。 想要改…

基于听歌习惯的自动音乐评分

我用 Delphi 创建了一个类似于 Winamp 的…