-
公开(公告)号:CN118297166A
公开(公告)日:2024-07-05
申请号:CN202410729045.6
申请日:2024-06-06
Applicant: 南京邮电大学
IPC: G06N5/04 , G06N5/045 , G06N3/042 , G06N3/0455 , G06N3/096 , G06F16/532 , G06F16/583 , G06F16/332 , G06F18/25
Abstract: 本发明公开基于先计划再求解思维链的科学问答任务解决方法;属于计算机视觉和自然语言处理领域;科学问答任务解决方法包括:设计语义适配器与视觉编码器和语言模型连接,得到多模态网络模型,并使用科学问答数据集中的训练集数据对多模态模型进行语义适配器预训练;使用预训练后的多模态网络模型对次优的原理解释进行筛选,并使用先计划再求解思维链为次优的原理解释生成按计划的原理解释,并用按计划的原理解释优化原有的次优原理解释;使用集成了按计划的原理解释的训练数据,微调预训练过的多模态网络模型并进行测试,输出答案。
-
公开(公告)号:CN118297166B
公开(公告)日:2024-08-06
申请号:CN202410729045.6
申请日:2024-06-06
Applicant: 南京邮电大学
IPC: G06N5/04 , G06N5/045 , G06N3/042 , G06N3/0455 , G06N3/096 , G06F16/532 , G06F16/583 , G06F16/332 , G06F18/25
Abstract: 本发明公开基于先计划再求解思维链的科学问答任务解决方法;属于计算机视觉和自然语言处理领域;科学问答任务解决方法包括:设计语义适配器与视觉编码器和语言模型连接,得到多模态网络模型,并使用科学问答数据集中的训练集数据对多模态模型进行语义适配器预训练;使用预训练后的多模态网络模型对次优的原理解释进行筛选,并使用先计划再求解思维链为次优的原理解释生成按计划的原理解释,并用按计划的原理解释优化原有的次优原理解释;使用集成了按计划的原理解释的训练数据,微调预训练过的多模态网络模型并进行测试,输出答案。
-