用于语音情感识别（SER）的隐马尔可夫模型与深度学习

在构建语音情感检测与识别系统时，哪种方法会更好？是使用隐马尔可夫模型还是深度学习（RNN-LSTM）方法？我需要构建一个SER系统，对这两种方法感到困惑。如果有比这两种更好的模型，请告知。

回答：

基于HMM和RNN-LSTM的解决方案在SER领域被认为不够精确。我认为目前最佳的算法是基于深度视网膜卷积神经网络（DRCNNs）的方法。参见使用深度视网膜卷积神经网络进行语音情感识别，作者为牛亚峰、邹东升、牛亚东、何仲实、谭华，发表于2017年7月。作者在以下数据库上实现了超过99%的平均准确率：IEMOCAP、EMO-DB和SAVEE。

学技术

用于语音情感识别（SER）的隐马尔可夫模型与深度学习

发表回复取消回复

相关文章：

Related Posts

使用LSTM在Python中预测未来值

如何在gensim的word2vec模型中查找双词组的相似性

dask_xgboost.predict 可以工作但无法显示 – 数据必须是一维的

ML Tuning – Cross Validation in Spark

如何在React JS中使用fetch从REST API获取预测

如何分析ML.NET中多类分类预测得分数组？

发表回复 取消回复

发表回复取消回复