-
公开(公告)号:CN119088982A
公开(公告)日:2024-12-06
申请号:CN202411192540.4
申请日:2024-08-28
Applicant: 国网山东省电力公司德州供电公司 , 北京邮电大学
IPC: G06F16/36 , G06F16/335 , G06F40/30 , G06N3/0455 , G06N3/082 , G06N5/022
Abstract: 本发明提供一种基于大小模型协作的数据增强实体关系三元组抽取方法,包括四个任务单元的架构设计:数据预处理任务、训练数据增强任务、多元实体对筛选任务和关系提取任务;充分利用文档的多模态信息作为句子文本补充,结合大小模型各自的优势以更好地进行实体关系三元组的提取,从而提高实体对筛选模型的训练效果和泛化能力,以处理包含多个实体关系三元组的复杂句式时的效率及准确性,不依赖于单一的数据源或传统信息抽取技术,具有高度的兼容性,可以广泛应用于电网业务领域中的多种信息抽取任务;还引入了依据大语言模型的初步提取结果的动态路由选择策略,以提高大语言模型在处理多个实体关系三元组时的鲁棒性,使其能够更准确地应对供应链管理中的复杂信息。