-
公开(公告)号:CN117633493A
公开(公告)日:2024-03-01
申请号:CN202311479686.2
申请日:2023-11-08
Applicant: 中国司法大数据研究院有限公司
IPC: G06F18/211 , G06F18/214 , G06F18/24
Abstract: 本发明公开了一种基于大模型辅助的案件特征识别方法。本方法为:1)获取多个案件并进行标注,得到一训练案件特征训练文本集;2)获取用于辅助选择最优特征提示模板的伪标注数据,作为辅助测试集;3)利用所选大模型为设定案由下的每个案件特征生成P个特征提示模板,利用多个其他大模型对每个案件特征的特征提示模板打分,选出排名前p个模板;将所选模板组合成q组实验数据,并划分为训练集和测试集;采用每组实验数据的训练集训练同一目标模型,得到q个训练后的模型;4)利用训练数据集训练q个模型得到最终的模型;5)将一目标文书中用于识别案件特征的数据输入模型中,得到该目标文书的案件特征。本发明提高了特征识别准确性和可靠性。
-
公开(公告)号:CN116127976B
公开(公告)日:2023-12-05
申请号:CN202310027146.4
申请日:2023-01-09
Applicant: 中国司法大数据研究院有限公司
IPC: G06F40/295 , G06F40/289 , G06F18/22 , G06Q50/18
Abstract: 本发明公开了一种公司名称的匹配方法、装置及电子设备,所述方法包括:获取待测公司名称中实体的实体类型,所述实体类型包括:区划、字号、行业和组织形式;基于所述实体类型,将所述实体组合成多个层级的模糊查询;利用所述多个层级的模糊查询,在ElasticSearch中进行公司名称的搜索,以得到名称匹配结果。本发明大幅度减少了人工检验的工作量,大大提升了校验速度。
-
公开(公告)号:CN116127976A
公开(公告)日:2023-05-16
申请号:CN202310027146.4
申请日:2023-01-09
Applicant: 中国司法大数据研究院有限公司
IPC: G06F40/295 , G06F40/289 , G06F18/22 , G06Q50/18
Abstract: 本发明公开了一种公司名称的匹配方法、装置及电子设备,所述方法包括:获取待测公司名称中实体的实体类型,所述实体类型包括:区划、字号、行业和组织形式;基于所述实体类型,将所述实体组合成多个层级的模糊查询;利用所述多个层级的模糊查询,在ElasticSearch中进行公司名称的搜索,以得到名称匹配结果。本发明大幅度减少了人工检验的工作量,大大提升了校验速度。
-
公开(公告)号:CN119719296A
公开(公告)日:2025-03-28
申请号:CN202411799924.2
申请日:2024-12-09
Applicant: 中国司法大数据研究院有限公司
IPC: G06F16/3329 , G06F16/334 , G06F16/36 , G06Q50/18
Abstract: 本发明公开一种基于法官视角的慢思考模式法律问答方法及装置,属于人工智能技术领域。所述方法包括:构建多维度法律向量知识库;对用户问题进行理解,生成若干检索查询语句;在所述多维度法律向量知识库中进行所述检索查询语句的检索,得到所述用户问题的相关法律知识;筛选所述相关法律知识,以构建候选知识库,并评估候选知识库中的法律知识是否足以充分解答该用户问题;在候选知识库中的法律知识足以充分解答该用户问题的情况下,基于候选知识库中的法律知识生成该用户问题的回答。本发明可以提高法律问答系统的准确性、可靠性、鲁棒性和全面性。
-
公开(公告)号:CN115858507A
公开(公告)日:2023-03-28
申请号:CN202211025841.9
申请日:2022-08-25
Applicant: 中国司法大数据研究院有限公司
IPC: G06F16/215 , G06F16/36 , G06N5/025 , G06Q10/063 , G06Q50/18
Abstract: 本发明涉及一种刑事量刑规则自动化评估、纠错与补全的方法和系统。该方法的步骤包括:利用结构化引擎,从相关法律法规中提取与刑事量刑相关的信息;根据提取的与刑事量刑相关的信息,对量刑规则所需的知识内容进行系统化处理;对全国各地区的各案由的量刑体系图谱进行知识对齐、融合;对全国各省的量刑规范化指导意见的规则统一形成知识库,并对其知识进行单规则评估和集成规则评估,实现刑事量刑规则自动化评估、纠错与补全。本发明通过对抽取的量刑情节及其规则的结构化和融合处理,并采用单规则模式和集成规则模式,能够实现量刑规则的自动化评估、纠错与补全。
-
公开(公告)号:CN120031008A
公开(公告)日:2025-05-23
申请号:CN202411925971.7
申请日:2024-12-25
Applicant: 中国司法大数据研究院有限公司
IPC: G06F40/186 , G06F40/30 , G06F16/334 , G06N5/02 , G06Q50/18 , G06N3/0455
Abstract: 本发明公开一种基于大模型和知识库增强的结构化法律公文生成方法及系统,属于结构化法律公文生成领域。所述方法包括:根据用户输入,获取案情描述和公文类型;基于案情描述检索法律法规知识库,得到与案情描述相关的关联法条集合;基于公文类型检索法律公文模板知识库,得到与公文类型相关的法律公文模板集合;在法律公文模板集合中存在适合案情描述,且与公文类型类型一致的法律公文模板的情况下,基于用户输入、关联法条集合和该法律公文模板,生成该用户输入的法律公文;否则,根据公文类型进行网络搜索,以生成结构化法律公文。本发明可以提高法律公文的可读性,并为用户提供更直观的阅读体验。
-
公开(公告)号:CN119989074A
公开(公告)日:2025-05-13
申请号:CN202411891827.6
申请日:2024-12-20
Applicant: 中国司法大数据研究院有限公司
IPC: G06F18/241 , G06F18/214 , G06F18/25 , G06F16/335
Abstract: 本发明公开了一种基于大模型融合多层级法律要素生成的相似案例检索方法,其步骤包括:1)基于法律文书的结构特点结合大模型设计多层级的法律要素知识库;2)接收用户对一目标案例进行检索其相似案例时所输入的问题,预测该问题的案由类别,并将预测的案由类别与其上级案由名称进行关联;然后预测该问题的问题类型;3)基于该问题的问题类型和所述法律要素知识库的类型特点,利用大模型生成抽取不同层面的法律要素信息,形成相应的待搜索法律要素集合;4)根据设定的不同召回策略在法律要素知识库进行搜索召回;5)根据各召回策略的权重比例以及各召回策略对应的召回个数,生成召回集合;6)根据召回集合得到目标案例的相似案例返回给用户。
-
公开(公告)号:CN119719462A
公开(公告)日:2025-03-28
申请号:CN202411799931.2
申请日:2024-12-09
Applicant: 中国司法大数据研究院有限公司
IPC: G06F16/953 , G06F16/35 , G06F40/194 , G06F40/186 , G06F18/23213
Abstract: 本发明公开一种基于大模型驱动的法律案情生成方法及装置,属于法律案情生成技术领域。所述方法包括:获取需生成案情的特定要素和案由名称,所述特定要素是基于所述需生成案情的基本特征和法律要点确定;检索涉及所述特定要素与案由名称的背景案情文本;检索涉及所述特定要素的法律定义与相关法律条款;将特定要素、背景案情文本以及所述特定要素的法律定义与相关法律条款嵌入到第一法律案情生成提示模板,并基于大语言模型生成目标案情文本。本发明能够在面对样本稀缺的情况下,自动生成内容丰富、贴近实际司法场景的案情文本,从而增强了法律文本生成的准确性和多样性。
-
公开(公告)号:CN116127977B
公开(公告)日:2023-10-03
申请号:CN202310082940.9
申请日:2023-02-08
Applicant: 中国司法大数据研究院有限公司
IPC: G06F40/295 , G06F40/284 , G06F40/30
Abstract: 本发明公开了一种面向裁判文书的伤亡人数提取方法,其步骤包括:1)对公开裁判文书集中的每一裁判文书进行分段处理,得到关联集合A1;2)从集合A1内每一裁判说理段中提取伤亡人数,将每一裁判文书的事实认定段、裁判说理段和伤亡人数作为一短文本,构建事实认定‑裁判说理‑伤亡人数关联集合A2;3)对集合A2中的每一短文本进行语义解析,识别出每个短文本中的人物类实体及其起止位置,得到数据集A3;对数据集A3进行标注,构建伤亡人数训练样本集合A4;4)基于集合A4训练基于提示学习的统一信息抽取模型,得到伤亡人数识别模型;5)对于一给定裁判文书的事实认定描述,采用伤亡人数识别模型,识别出该裁判文书中的伤亡人数。
-
公开(公告)号:CN116304019A
公开(公告)日:2023-06-23
申请号:CN202310028014.3
申请日:2023-01-09
Applicant: 中国司法大数据研究院有限公司
IPC: G06F16/35 , G06F40/211 , G06F40/289 , G06Q50/18
Abstract: 本发明公开了一种争议焦点体系构建与识别方法。本方法步骤包括:1)对裁判文书集中的每一裁判文书进行分段处理,得到裁判文书的事实认定段和裁判说理段集合D;2)从集合D中筛选出蕴含争议焦点的事实认定段和裁判说理段,得到蕴含争议焦点的数据集D1;从数据集D1中提取争议焦点语句,得到争议焦点数据集D2;3)对数据集D2进行聚类,形成争议焦点语句聚类簇;4)结合相关法律知识对聚类结果进行归纳总结,形成多层级争议焦点知识体系;5)结合知识体系对裁判文书集中的裁判文书进行标注,得到争议焦点知识体系识别模型;6)当给定一篇裁判文书A,提取裁判文书A中的争议焦点语句并将其输入该模型,识别出裁判文书A的争议焦点。
-
-
-
-
-
-
-
-
-