一种基于CapCNN的实时语音情感识别方法及应用装置

    公开(公告)号:CN113362857A

    公开(公告)日:2021-09-07

    申请号:CN202110663975.2

    申请日:2021-06-15

    Applicant: 厦门大学

    Abstract: 一种基于CapCNN的实时语音情感识别方法及应用装置,涉及生物特征识别技术领域,所述方法包括:步骤一、搜集一定数量的自闭症儿童的语音数据,对提取出来的数据进行预处理,包括端点检测和分帧加窗的操作;步骤二、提取预处理过后的语音数据的语谱特征作为输入数据;步骤三、构建基于CapCNN的模型,将输入数据经过训练,判断输入语音的情感;步骤四、结合输入数据和模型中的情感分类,与识别对象进行交互。本发明实现了更高的准确率,相比其他语音情感识别的方法,在语音的短时识别上表现的更好,且在多个数据集中都表现出更好的鲁棒性,能够较好地把握语谱图的位置信息和整体特征,是一种高效稳定语音情感识别方法。

    一种基于GTCN的实时语音情感识别方法及应用装置

    公开(公告)号:CN113257279A

    公开(公告)日:2021-08-13

    申请号:CN202110316240.2

    申请日:2021-03-24

    Applicant: 厦门大学

    Abstract: 一种基于GTCN的实时语音情感识别方法及应用装置,涉及生物特征识别技术领域,方法包括:步骤一、搜集一定数量的虚拟现实交互式语音游戏玩家的语音数据,对提取出来的数据进行预处理,包括端点检测和分帧加窗的操作;步骤二、提取预处理过后的语音数据的组合特征作为输入数据;步骤三、构建基于GTCN的模型,将输入数据经过训练,判断输入语音的情感;步骤四、结合输入数据和模型中的情感分类,与识别对象进行交互。相比其他语音情感识别方法,本发明实现了更高的准确率,在多个数据集中都表现出更佳的情感分类效果和更好的鲁棒性,并且能够以更高的效率和更低的内存进行训练,是一种高效稳定的语音情感识别方法。

Patent Agency Ranking