-
公开(公告)号:CN117390196A
公开(公告)日:2024-01-12
申请号:CN202311346047.9
申请日:2023-10-17
Applicant: 北京计算机技术及应用研究所
IPC: G06F16/36 , G06F18/2415 , G06N3/04
Abstract: 本发明涉及一种基于大模型抽象事理图谱构建的事件预测方法,属于人工智能、大数据领域。本发明首先基于大模型chatGLM2抽取事件信息,构建抽象事理图谱;再者,基于抽象事理图谱筛选出候选事件,形成新的事件链条;最后,将新的事件链条作为图神经网络事件预测模型的输入,预测出候选事件。本发明提出了融合候选事件转移概率的注意力机制,一方面,学习候选事件和已发生事件上下文的相关性;另一方面,也学习了候选事件本身的概率信息。本发明提出的模型不仅增强了可解释性,也学习到了上下文信息。
-
公开(公告)号:CN117217222A
公开(公告)日:2023-12-12
申请号:CN202310746380.2
申请日:2023-06-25
Applicant: 北京计算机技术及应用研究所
IPC: G06F40/295 , G06F18/15 , G06F18/214 , G06F18/241
Abstract: 本发明涉及一种军事领域标注数据修正与事件检测方法,属于信息抽取技术领域。本发明使用原始数据集训练模型,并对原始标注数据进行预测,对于预测得分大于一定阈值的样本,将原始数据集的标注结果修改为模型预测结果,从而修正数据集中的错误标注数据和污染数据,提高训练集的质量。本发明在模型训练时引入了分层学习率策略,为靠近下游任务的模型层参数设置更大的学习率,提高预训练模型对于下游任务的适配能力;在模型推理时采用基于投票修正的模型融合方法,通过模型集成的方式提升少样本类别事件的召回率和准确率,融合多个模型的投票结果确定最终预测结果,从而提升模型的鲁棒性。
-