发明公开
- 专利标题: 一种跨模态多质量评价数据集联合训练方法和系统
-
申请号: CN202311371480.8申请日: 2023-10-20
-
公开(公告)号: CN117633526A公开(公告)日: 2024-03-01
- 发明人: 闵雄阔 , 曹于勤 , 高艺璇 , 孙伟 , 翟广涛
- 申请人: 上海交通大学
- 申请人地址: 上海市闵行区东川路800号
- 专利权人: 上海交通大学
- 当前专利权人: 上海交通大学
- 当前专利权人地址: 上海市闵行区东川路800号
- 代理机构: 上海恒慧知识产权代理事务所
- 代理商 张琳
- 主分类号: G06F18/214
- IPC分类号: G06F18/214 ; G06F18/213 ; G06F18/25 ; G06N3/045 ; G06Q10/0639
摘要:
本发明提供一种跨模态多质量评价数据集联合训练方法和系统,包括:构建跨模态多质量评价模型,包括特征提取和特征融合两部分;其训练过程共三步:第一步,根据待训练的质量评价数据集个数M,将特征融合部分扩展为M个后,各数据集共用特征提取部分提取特征后输入各数据集对应的特征融合部分进行训练。第二步,特征提取部分继承第一步训练后的模型参数,且将特征融合部分根据模态个数N进行拓展后进行训练。第三步,特征提取部分继承第二步训练后的模型参数,冻结特征提取部分的模型参数,将特征提取部分复原为一个后进行训练。本发明有效地利用跨模态的音频、图像、视频及音视频质量评价数据集来联合训练多模态的跨模态多质量评价模型。