-
公开(公告)号:CN119003791A
公开(公告)日:2024-11-22
申请号:CN202411455598.3
申请日:2024-10-18
Applicant: 北京北大软件工程股份有限公司
Abstract: 本申请公开了一种篇章级关系抽取方法、装置、设备、介质及产品,涉及自然语言处理技术领域,该方法包括:获取待抽取篇章级关系的目标篇章文档;获取目标篇章文档中的第一关系三元组;根据第一关系三元组中的关系在预设规则库中获取与关系对应的目标规则,目标规则包括:关系与新推断关系的映射关系,以及新推断关系中的实体的属性信息;根据目标篇章文档、第一关系三元组中包括的实体的属性信息和目标规则,推断第一关系三元组中包含的新推断关系三元组;输出第一关系三元组和新推断关系三元组。本申请可以提升推断出的新的关系组的准确性。
-
公开(公告)号:CN118069789B
公开(公告)日:2024-07-23
申请号:CN202410464773.9
申请日:2024-04-18
Applicant: 北京北大软件工程股份有限公司
Abstract: 本发明公开一种面向立法意见的关键信息抽取方法、系统及设备,涉及自然语言处理技术领域。该方法包括对证据信息的输入文本和所有待分类关系类别标签进行预处理,得到预处理后的文本;所述预处理包括:文档分割和预训练语言模型的处理;根据预处理后的文本,采用因果驱动的证据语义模型和因果驱动的标签语义模型,基于连续优化的NoTEARS因果发现算法以及L层R‑GCN图神经网络,确定去噪后证据信息和语义增强后的标签信息;根据去噪后证据信息和语义增强后的标签信息进行双向语义匹配,并将双向语义匹配的匹配分数进行聚合,得到综合打分;根据综合打分进行实体关系抽取。本发明能够充分利用外部知识,解决数据标签分布不均衡问题。
-
公开(公告)号:CN119003791B
公开(公告)日:2025-01-21
申请号:CN202411455598.3
申请日:2024-10-18
Applicant: 北京北大软件工程股份有限公司
Abstract: 本申请公开了一种篇章级关系抽取方法、装置、设备、介质及产品,涉及自然语言处理技术领域,该方法包括:获取待抽取篇章级关系的目标篇章文档;获取目标篇章文档中的第一关系三元组;根据第一关系三元组中的关系在预设规则库中获取与关系对应的目标规则,目标规则包括:关系与新推断关系的映射关系,以及新推断关系中的实体的属性信息;根据目标篇章文档、第一关系三元组中包括的实体的属性信息和目标规则,推断第一关系三元组中包含的新推断关系三元组;输出第一关系三元组和新推断关系三元组。本申请可以提升推断出的新的关系组的准确性。
-
公开(公告)号:CN118069789A
公开(公告)日:2024-05-24
申请号:CN202410464773.9
申请日:2024-04-18
Applicant: 北京北大软件工程股份有限公司
Abstract: 本发明公开一种面向立法意见的关键信息抽取方法、系统及设备,涉及自然语言处理技术领域。该方法包括对证据信息的输入文本和所有待分类关系类别标签进行预处理,得到预处理后的文本;所述预处理包括:文档分割和预训练语言模型的处理;根据预处理后的文本,采用因果驱动的证据语义模型和因果驱动的标签语义模型,基于连续优化的NoTEARS因果发现算法以及L层R‑GCN图神经网络,确定去噪后证据信息和语义增强后的标签信息;根据去噪后证据信息和语义增强后的标签信息进行双向语义匹配,并将双向语义匹配的匹配分数进行聚合,得到综合打分;根据综合打分进行实体关系抽取。本发明能够充分利用外部知识,解决数据标签分布不均衡问题。
-
-
-