-
公开(公告)号:CN116402055A
公开(公告)日:2023-07-07
申请号:CN202310594616.5
申请日:2023-05-25
Applicant: 武汉大学
IPC: G06F40/295 , G06N3/044 , G06N3/08 , G06F18/25
Abstract: 本申请公开了一种专利文本实体的抽取方法、装置、设备及介质,根据权利要求文本中的权利要求主题、权利要求引用关系和权利要求序号生成至少一个三元组,并根据三元组生对应成权利要求主题的引用关系拓扑图;将各个引用关系拓扑图对应的权利要求文本输入至预训练模型bert中,生成第一实体对;按照引用关系将各个引用关系拓扑图对应的权利要求文本划分为至少一个技术方案块,并分别将技术方案块输入至预训练模型bert中,生成对应的技术方案实体对;对技术方案实体对进行拼接生成第二实体对;剪切融合第一实体对和第二实体对生成权利要求实体对。根据权利要求主题的整体文本和技术方案块文本提取实体对,使得生成的权利要求实体对具有更高的准确度。
-
公开(公告)号:CN116402055B
公开(公告)日:2023-08-25
申请号:CN202310594616.5
申请日:2023-05-25
Applicant: 武汉大学
IPC: G06F40/295 , G06N3/044 , G06N3/08 , G06F18/25
Abstract: 本申请公开了一种专利文本实体的抽取方法、装置、设备及介质,根据权利要求文本中的权利要求主题、权利要求引用关系和权利要求序号生成至少一个三元组,并根据三元组生对应成权利要求主题的引用关系拓扑图;将各个引用关系拓扑图对应的权利要求文本输入至预训练模型bert中,生成第一实体对;按照引用关系将各个引用关系拓扑图对应的权利要求文本划分为至少一个技术方案块,并分别将技术方案块输入至预训练模型bert中,生成对应的技术方案实体对;对技术方案实体对进行拼接生成第二实体对;剪切融合第一实体对和第二实体对生成权利要求实体对。根据权利要求主题的整体文本和技术方案块文本提取实体对,使得生成的权利要求实体对具有更高的准确度。
-