基于记忆胶囊与注意力的语音情感识别-计算机工程2025年04期-手机知网

基于记忆胶囊与注意力的语音情感识别

当前语音情感识别中因情感特征提取不充分和模型对复杂情感表达建模能力不足，导致识别准确率降低。为了提高当前语音情感识别准确率，提出一种基于记忆胶囊和注意力的语音情感识别方法。首先，提取了语音中梅尔频率倒谱系数(MFCC)、能量的均方根(RMS)、梅尔语谱图、过零率(ZCR)、色度分布5种特征；然后，在MFCC特征的基础上，提取MFCC的一阶、二阶和三阶差分动态特征，并将其拼接；最后，将这些特征堆叠成一维向量的形式，通过引入记忆胶囊和注意力机制所构建的模型，完成对语音情感识别分类工作。实验结果表明，所提的模型具有较好的泛化性和鲁棒性，有效提升了语音情感识别的准确率，在RAVDESS、EMODB和IEMOCAP 3个数据集上的准确率分别达到了95.87%、98.82%和98.23%,与现有的方法相比，识别准确率均得到了有效提升。