-
公开(公告)号:CN113553385A
公开(公告)日:2021-10-26
申请号:CN202110770848.2
申请日:2021-07-08
Applicant: 北京计算机技术及应用研究所
IPC: G06F16/28 , G06F16/35 , G06F16/215 , G06F40/30 , G06F40/211 , G06F40/295 , G06N3/04 , G06N3/08 , G06K9/62 , G06Q50/18
Abstract: 本发明涉及一种司法文书中法律要素的关系抽取方法,属于自然语言处理领域。本发明对司法文书进行数据清洗;将清洗过的司法文书根据各类型文书的规则机制进行段落划分;利用“三位标注”的标注方式对法律要素的实体及实体主客体的关系进行标注;使用标注的数据作为深度神经网络模型的原始输入,完成法律要素的实体及实体间关系的识别及抽取。本发明有效避免因传统句法树导致的结构嵌套以及实体关系重叠,有利于提高案件要素实体的识别性能。本发明实现了案件要素的实体识别及关系抽取,取得了良好的使用效果。
-
公开(公告)号:CN111783399A
公开(公告)日:2020-10-16
申请号:CN202010586120.X
申请日:2020-06-24
Applicant: 北京计算机技术及应用研究所
IPC: G06F40/131 , G06F40/151 , G06F40/205 , G06N3/02
Abstract: 本发明涉及一种法律裁判文书信息抽取方法,其中,包括:步骤一:根据不同的案由选择相对应的规则引擎、关键字字典以及模版引擎;步骤二:将裁判文书进行数据清洗;步骤三:将裁判文书的内容按照分段进行分割;步骤四:将分割的裁判文书的内容作为基于注意力机制的序列作为神经网络模型的输入,进行标签信息的提取;步骤五:将神经网络提取的信息进行微调;步骤六:根据提取的标签信息以及对应的模板引擎,生成所需要格式的结构化文档。本发明针对现有规则的解析缺点,利用深度学习技术,构建了基于注意力机制的神经网络模型,可以大大提高法律要素提取的效率与准确度。
-