-
公开(公告)号:CN114662659A
公开(公告)日:2022-06-24
申请号:CN202210237867.3
申请日:2022-03-11
Applicant: 南京信息工程大学
IPC: G06N3/04 , G06N3/08 , G06K9/62 , G06F40/284 , G06F40/30 , G06F40/216
Abstract: 本发明提供一种基于多阶段迁移学习策略综合的众包文本集成方法,具体为1、构建迁移式生成型众包文本集成模型TTGCIF;2、获得源域文本数据集和目标域文本数据集的语义原型;3、对语义原型进行词嵌入处理;4、根据最大均值差异做数据分布对齐;5、对TTGCIF进行语义原型转导模型训练;6、将源域文本数据集处理为训练任务集;7、将训练任务集输入到TTGCIF中进行领域快速适应模型训练;8、将部分目标域文本数据集输入到TTGCIF中进行模型微调训练。通过以上过程,实现文本集成。本发明能够摒弃传统方法中对数据标签的需求,减少人力物力的浪费,对数据稀缺场景下进行众包文本集成的有着极大的促进作用。
-
公开(公告)号:CN115423106A
公开(公告)日:2022-12-02
申请号:CN202211374352.4
申请日:2022-11-04
Applicant: 南京信息工程大学
IPC: G06N5/04 , G06N5/02 , G06N3/04 , G06N3/08 , G06F16/36 , G06F40/169 , G06F40/205 , G06F16/35
Abstract: 本发明提供了一种基于多模态事件知识图谱的溯因推理方法,有机混合了事件知识图谱和多模态知识图谱的本体层和事实层,使事实知识可以通过多模态事件知识图谱的形式存储和使用,丰富了现行的知识组织和使用形式;同时对ege‑RoBERTa模型进行拓宽,增加了额外知识接口以及卷积自编码器训练通道,使其可以支持多模态事件信息作为额外知识辅助推理,得到更好的推理结果。
-
公开(公告)号:CN114662659B
公开(公告)日:2022-09-16
申请号:CN202210237867.3
申请日:2022-03-11
Applicant: 南京信息工程大学
IPC: G06N3/04 , G06N3/08 , G06K9/62 , G06F40/284 , G06F40/30 , G06F40/216
Abstract: 本发明提供一种基于多阶段迁移学习策略综合的众包文本集成方法,具体为1、构建迁移式生成型众包文本集成模型TTGCIF;2、获得源域文本数据集和目标域文本数据集的语义原型;3、对语义原型进行词嵌入处理;4、根据最大均值差异做数据分布对齐;5、对TTGCIF进行语义原型转导模型训练;6、将源域文本数据集处理为训练任务集;7、将训练任务集输入到TTGCIF中进行领域快速适应模型训练;8、将部分目标域文本数据集输入到TTGCIF中进行模型微调训练。通过以上过程,实现文本集成。本发明能够摒弃传统方法中对数据标签的需求,减少人力物力的浪费,对数据稀缺场景下进行众包文本集成的有着极大的促进作用。
-
-