-
公开(公告)号:CN113362857A
公开(公告)日:2021-09-07
申请号:CN202110663975.2
申请日:2021-06-15
Applicant: 厦门大学
Abstract: 一种基于CapCNN的实时语音情感识别方法及应用装置,涉及生物特征识别技术领域,所述方法包括:步骤一、搜集一定数量的自闭症儿童的语音数据,对提取出来的数据进行预处理,包括端点检测和分帧加窗的操作;步骤二、提取预处理过后的语音数据的语谱特征作为输入数据;步骤三、构建基于CapCNN的模型,将输入数据经过训练,判断输入语音的情感;步骤四、结合输入数据和模型中的情感分类,与识别对象进行交互。本发明实现了更高的准确率,相比其他语音情感识别的方法,在语音的短时识别上表现的更好,且在多个数据集中都表现出更好的鲁棒性,能够较好地把握语谱图的位置信息和整体特征,是一种高效稳定语音情感识别方法。
-
公开(公告)号:CN113257279A
公开(公告)日:2021-08-13
申请号:CN202110316240.2
申请日:2021-03-24
Applicant: 厦门大学
Abstract: 一种基于GTCN的实时语音情感识别方法及应用装置,涉及生物特征识别技术领域,方法包括:步骤一、搜集一定数量的虚拟现实交互式语音游戏玩家的语音数据,对提取出来的数据进行预处理,包括端点检测和分帧加窗的操作;步骤二、提取预处理过后的语音数据的组合特征作为输入数据;步骤三、构建基于GTCN的模型,将输入数据经过训练,判断输入语音的情感;步骤四、结合输入数据和模型中的情感分类,与识别对象进行交互。相比其他语音情感识别方法,本发明实现了更高的准确率,在多个数据集中都表现出更佳的情感分类效果和更好的鲁棒性,并且能够以更高的效率和更低的内存进行训练,是一种高效稳定的语音情感识别方法。
-
公开(公告)号:CN113257279B
公开(公告)日:2025-01-10
申请号:CN202110316240.2
申请日:2021-03-24
Applicant: 厦门大学
IPC: G10L25/63 , G10L25/30 , G10L25/03 , G10L25/24 , G10L25/18 , G06F18/2415 , G06N3/0464 , G06N3/045 , G06N3/0442 , G06N3/084 , G06N3/048
Abstract: 一种基于GTCN的实时语音情感识别方法及应用装置,涉及生物特征识别技术领域,方法包括:步骤一、搜集一定数量的虚拟现实交互式语音游戏玩家的语音数据,对提取出来的数据进行预处理,包括端点检测和分帧加窗的操作;步骤二、提取预处理过后的语音数据的组合特征作为输入数据;步骤三、构建基于GTCN的模型,将输入数据经过训练,判断输入语音的情感;步骤四、结合输入数据和模型中的情感分类,与识别对象进行交互。相比其他语音情感识别方法,本发明实现了更高的准确率,在多个数据集中都表现出更佳的情感分类效果和更好的鲁棒性,并且能够以更高的效率和更低的内存进行训练,是一种高效稳定的语音情感识别方法。
-
-