-
公开(公告)号:CN120030141A
公开(公告)日:2025-05-23
申请号:CN202411925975.5
申请日:2024-12-25
Applicant: 中国司法大数据研究院有限公司
IPC: G06F16/334 , G06N5/02 , G06Q50/18
Abstract: 本发明公开一种基于思维链的民事裁判结果预测方法及系统,属于自然语言处理技术领域。本发明旨在利用思维链技术,充分利用案件事实以及原告诉称、被告辩称之间的信息,以权利请求为出发点、以实体法律规范构成要件分析为基本手段,把民事审判的法律逻辑进行拆解,通过一系列有逻辑关系的思考形成完整的民事案件审判过程,有效应对民事案件多样性、复杂性带来的挑战,确保民事裁判结果预测在精确度和逻辑严密性上达到更高水平。
-
公开(公告)号:CN116304033A
公开(公告)日:2023-06-23
申请号:CN202310171687.4
申请日:2023-02-27
Applicant: 中国司法大数据研究院有限公司
IPC: G06F16/35 , G06F18/24 , G06F18/214 , G06F18/21
Abstract: 本发明公开了一种基于半监督、双层多分类的诉请识别方法,其步骤包括:1)获取训练文本集,包括标注数据集和未标注数据集;2)利用标注数据集对教师模型进行训练并得到各标注类别的自适应阈值;利用训练后的教师模型对未标注数据集中的每一未标注诉讼请求数据进行分类和标注,得到伪标签标注数据;3)利用伪标签标注数据和有标注诉讼请求数据训练学生模型,得到学生模型;4)利用学生模型对测试集中的数据进行分类预测,根据分类预测结果计算每一类别的F1分数;如果低于设定阈值,则将该类别下样本训练得到多任务模型;5)将学生模型和多任务模型串联组成双层模型;6)将待分类的民事诉请文本输入双层模型中,得到诉讼请求类别。
-
公开(公告)号:CN117350294A
公开(公告)日:2024-01-05
申请号:CN202311418562.3
申请日:2023-10-30
Applicant: 中国司法大数据研究院有限公司
IPC: G06F40/295 , G06F18/214 , G06F18/22 , G06F18/213 , G06Q50/18
Abstract: 本发明公开了一种基于法律文书结构特点的案由识别方法及装置。本方法包括:1)根据确定支持的案件类型和文书类型,获取每一案件类型的多个案件;2)针对每一案件类型,构建该案件类型的标准案由库;3)根据每一案件类型的标准案由库,结合该案件类型的案件文书数据的段落特点相互校验的方式构建训练样本集;4)计算每一样本的案由名称在案由提取段中的位置,得到符合UIE模型的训练集格式的训练样本集合U;5)利用训练样本集合U训练所述UIE模型,得到命名体识别模型;6)将待处理文书数据集中一案件A的文书数据输入命名体识别模型,得到该案件A的备选案由集;将该备选案由集与对应的标准案由库进行匹配,得到案件A的案由名称。
-
公开(公告)号:CN116304033B
公开(公告)日:2023-11-03
申请号:CN202310171687.4
申请日:2023-02-27
Applicant: 中国司法大数据研究院有限公司
IPC: G06F16/35 , G06F18/24 , G06F18/214 , G06F18/21
Abstract: 本发明公开了一种基于半监督、双层多分类的诉请识别方法,其步骤包括:1)获取训练文本集,包括标注数据集和未标注数据集;2)利用标注数据集对教师模型进行训练并得到各标注类别的自适应阈值;利用训练后的教师模型对未标注数据集中的每一未标注诉讼请求数据进行分类和标注,得到伪标签标注数据;3)利用伪标签标注数据和有标注诉讼请求数据训练学生模型,得到学生模型;4)利用学生模型对测试集中的数据进行分类预测,根据分类预测结果计算每一类别的F1分数;如果低于设定阈值,则将该类别下样本训练得到多任务模型;5)将学生模型和多任务模型串联组成双层模型;6)将待分类的民事诉请文本输入双层模型中,得到诉讼请求类别。
-
公开(公告)号:CN120031008A
公开(公告)日:2025-05-23
申请号:CN202411925971.7
申请日:2024-12-25
Applicant: 中国司法大数据研究院有限公司
IPC: G06F40/186 , G06F40/30 , G06F16/334 , G06N5/02 , G06Q50/18 , G06N3/0455
Abstract: 本发明公开一种基于大模型和知识库增强的结构化法律公文生成方法及系统,属于结构化法律公文生成领域。所述方法包括:根据用户输入,获取案情描述和公文类型;基于案情描述检索法律法规知识库,得到与案情描述相关的关联法条集合;基于公文类型检索法律公文模板知识库,得到与公文类型相关的法律公文模板集合;在法律公文模板集合中存在适合案情描述,且与公文类型类型一致的法律公文模板的情况下,基于用户输入、关联法条集合和该法律公文模板,生成该用户输入的法律公文;否则,根据公文类型进行网络搜索,以生成结构化法律公文。本发明可以提高法律公文的可读性,并为用户提供更直观的阅读体验。
-
公开(公告)号:CN119719462A
公开(公告)日:2025-03-28
申请号:CN202411799931.2
申请日:2024-12-09
Applicant: 中国司法大数据研究院有限公司
IPC: G06F16/953 , G06F16/35 , G06F40/194 , G06F40/186 , G06F18/23213
Abstract: 本发明公开一种基于大模型驱动的法律案情生成方法及装置,属于法律案情生成技术领域。所述方法包括:获取需生成案情的特定要素和案由名称,所述特定要素是基于所述需生成案情的基本特征和法律要点确定;检索涉及所述特定要素与案由名称的背景案情文本;检索涉及所述特定要素的法律定义与相关法律条款;将特定要素、背景案情文本以及所述特定要素的法律定义与相关法律条款嵌入到第一法律案情生成提示模板,并基于大语言模型生成目标案情文本。本发明能够在面对样本稀缺的情况下,自动生成内容丰富、贴近实际司法场景的案情文本,从而增强了法律文本生成的准确性和多样性。
-
公开(公告)号:CN117350294B
公开(公告)日:2024-10-11
申请号:CN202311418562.3
申请日:2023-10-30
Applicant: 中国司法大数据研究院有限公司
IPC: G06F40/295 , G06F18/214 , G06F18/22 , G06F18/213 , G06Q50/18
Abstract: 本发明公开了一种基于法律文书结构特点的案由识别方法及装置。本方法包括:1)根据确定支持的案件类型和文书类型,获取每一案件类型的多个案件;2)针对每一案件类型,构建该案件类型的标准案由库;3)根据每一案件类型的标准案由库,结合该案件类型的案件文书数据的段落特点相互校验的方式构建训练样本集;4)计算每一样本的案由名称在案由提取段中的位置,得到符合UIE模型的训练集格式的训练样本集合U;5)利用训练样本集合U训练所述UIE模型,得到命名体识别模型;6)将待处理文书数据集中一案件A的文书数据输入命名体识别模型,得到该案件A的备选案由集;将该备选案由集与对应的标准案由库进行匹配,得到案件A的案由名称。
-
公开(公告)号:CN117609758A
公开(公告)日:2024-02-27
申请号:CN202311464958.1
申请日:2023-11-06
Applicant: 中国司法大数据研究院有限公司
IPC: G06F18/213 , G06F18/214 , G06N5/04
Abstract: 本发明公开了一种基于一致性思维链推理的多任务案件特征提取方法,其步骤包括:S1:对所选公开裁判文书集中的每一裁判文书进行分段处理,得到事实认定段集合A1;S2:构建案件特征解释集合E1,利用大语言模型构建思维链集合E2;S3:利用思维链集合E2构建含思维链的提示指令,调用大语言模型,构建案件特征提取模型M1;S4:基于投票的自适应方法,利用模型M1对集合A1进行案件特征提取,得到事实认定段的案件特征预测标签集B及对应的推理过程R;S5:基于标签集B及推理过程R构建训练集训练生成式模型,得到案件特征多任务提取模型;S6:将待处理裁判文书的事实认定段输入到案件特征多任务提取模型,得到案件特征。
-
公开(公告)号:CN117633493A
公开(公告)日:2024-03-01
申请号:CN202311479686.2
申请日:2023-11-08
Applicant: 中国司法大数据研究院有限公司
IPC: G06F18/211 , G06F18/214 , G06F18/24
Abstract: 本发明公开了一种基于大模型辅助的案件特征识别方法。本方法为:1)获取多个案件并进行标注,得到一训练案件特征训练文本集;2)获取用于辅助选择最优特征提示模板的伪标注数据,作为辅助测试集;3)利用所选大模型为设定案由下的每个案件特征生成P个特征提示模板,利用多个其他大模型对每个案件特征的特征提示模板打分,选出排名前p个模板;将所选模板组合成q组实验数据,并划分为训练集和测试集;采用每组实验数据的训练集训练同一目标模型,得到q个训练后的模型;4)利用训练数据集训练q个模型得到最终的模型;5)将一目标文书中用于识别案件特征的数据输入模型中,得到该目标文书的案件特征。本发明提高了特征识别准确性和可靠性。
-
-
-
-
-
-
-
-