-
公开(公告)号:CN118571216B
公开(公告)日:2024-11-01
申请号:CN202411060512.7
申请日:2024-08-05
Applicant: 南京信息工程大学
Abstract: 本发明公开了基于语音语料对齐与自适应融合的语音分类方法,方法包括:构建语音分类数据集,并划分为训练集与测试集;构建语音分类网络模型,包括对齐构造模块、语音关联性构建模块、片段重要性挖掘模块、融合检测模块;将融合检测模块输出特征输入分类器以获得预测结果;设计用于优化网络模型参数的损失函数,根据损失函数在训练集上采用Adam优化器实现模型参数的迭代优化与更新;训练完成的语音分类网络模型可实现对语音信号的端对端分类。本发明利用深度学习技术通过语音信号实现自动分类,可应用于不同场景,如对情感、性别、年龄等特征的识别,有助于企业分析用户的情感、性别、年龄,从而提供更人性化、更具针对性的服务。
-
公开(公告)号:CN117540023A
公开(公告)日:2024-02-09
申请号:CN202410021947.4
申请日:2024-01-08
Applicant: 南京信息工程大学
IPC: G06F16/35 , G06F40/30 , G06N3/0464 , G06N3/08
Abstract: 本发明公开了基于模态融合图卷积网络的图像联合文本情感分析方法,包括:获取包含用户情感信息的图像以及文本数据;构建基于模态融合图卷积网络的图像联合文本情感分析模型,包括图文特征提取模块、语义增强图卷积模块和全局融合模块;设计损失函数,采用Adam优化器实现模型参数的迭代优化与更新;训练完成的网络模型能够实现对用户情感倾向的端到端分类。本发明利用深度学习技术,通过用户在社交平台上发布的图像与文本信息准确分析其情感倾向,有助于企业分析客户对相关产品的态度倾向,亦有助于社交媒体平台通过用户浏览的图文内容判断其喜好。
-
公开(公告)号:CN118571216A
公开(公告)日:2024-08-30
申请号:CN202411060512.7
申请日:2024-08-05
Applicant: 南京信息工程大学
Abstract: 本发明公开了基于语音语料对齐与自适应融合的语音分类方法,方法包括:构建语音分类数据集,并划分为训练集与测试集;构建语音分类网络模型,包括对齐构造模块、语音关联性构建模块、片段重要性挖掘模块、融合检测模块;将融合检测模块输出特征输入分类器以获得预测结果;设计用于优化网络模型参数的损失函数,根据损失函数在训练集上采用Adam优化器实现模型参数的迭代优化与更新;训练完成的语音分类网络模型可实现对语音信号的端对端分类。本发明利用深度学习技术通过语音信号实现自动分类,可应用于不同场景,如对情感、性别、年龄等特征的识别,有助于企业分析用户的情感、性别、年龄,从而提供更人性化、更具针对性的服务。
-
-