一种基于改进Transformer的多模态情感识别方法和系统

    公开(公告)号:CN115272908A

    公开(公告)日:2022-11-01

    申请号:CN202210707463.6

    申请日:2022-06-21

    Inventor: 丁俊丰 闫静杰

    Abstract: 本发明提供了一种基于改进Transformer的多模态情感识别方法和实施该方法的系统。该方法包括以下步骤:对视频、语音、文本数据库中的每个模态进行预处理,提取各样本数据特征,每个数据样本生成一个二维特征向量;通过跨模态注意力模型,获取两种模态间全局交互的特征;通过自注意力模型,获取单模态内全局交互的特征;构建由BiGRU2D替代多头注意力模块的改进Transformer模型,提取深层次特征;利用处理好的数据样本对构建网络模型进行训练,将训练好的模型用于多元情感的分类。本发明不仅提取了模态间的交互特征,还考虑了模态内的交互特征信息,并且通过改进的轻量级Transformer编码器提取高级特征,更快速、高效的解决了情感分类问题。

Patent Agency Ranking