-
公开(公告)号:CN117035075B
公开(公告)日:2024-01-12
申请号:CN202311303533.2
申请日:2023-10-10
Applicant: 人民法院信息技术服务中心 , 中国司法大数据研究院有限公司
Abstract: 本文涉及大数据领域,提供一种要素知识库的更新方法及装置,要素知识库内置于要素式审判系统中,方法包括:获取预定时间段及预定区域内各法官利用要素式审判系统进行要素式审判时产生的对要素项的使用行为数据;分析各法官对要素项的使用行为数据,确定各法官对各要素项的使用反馈类型,将各法官对各要素项的使用反馈类型存储至经验池中;对于每一要素项的每一使用反馈类型,根据所述经验池中的数据,计算该要素项的该使用反馈类型的累积量;若该要素项的该使用反馈类型的累积量达到该使用反馈类型的更新阈值,则在要素知识库中更新该要素项的相关内容。本文能及时适应要素项变化,自动更新要素式知识库,提高要素式审判系统的使用体验。
-
公开(公告)号:CN117035075A
公开(公告)日:2023-11-10
申请号:CN202311303533.2
申请日:2023-10-10
Applicant: 人民法院信息技术服务中心 , 中国司法大数据研究院有限公司
Abstract: 本文涉及大数据领域,提供一种要素知识库的更新方法及装置,要素知识库内置于要素式审判系统中,方法包括:获取预定时间段及预定区域内各法官利用要素式审判系统进行要素式审判时产生的对要素项的使用行为数据;分析各法官对要素项的使用行为数据,确定各法官对各要素项的使用反馈类型,将各法官对各要素项的使用反馈类型存储至经验池中;对于每一要素项的每一使用反馈类型,根据所述经验池中的数据,计算该要素项的该使用反馈类型的累积量;若该要素项的该使用反馈类型的累积量达到该使用反馈类型的更新阈值,则在要素知识库中更新该要素项的相关内容。本文能及时适应要素项变化,自动更新要素式知识库,提高要素式审判系统的使用体验。
-
公开(公告)号:CN114943309B
公开(公告)日:2022-10-21
申请号:CN202210856488.2
申请日:2022-07-21
Applicant: 人民法院信息技术服务中心
Abstract: 本文涉及区块链技术领域,尤其涉及一种区块链的异常诊断模型的构建方法及异常诊断方法。包括,获取区块链的多项监测指标的数据;将每项监测指标的数据划分为多个按顺序排列的第一训练集;将每个第一训练集输入到对应的孤立树模型进行训练并得到多个第一诊断结果;对多个第一诊断结果进行投票得到每一项监测指标的第二诊断结果;将每一项监测指标的第二诊断结果作为第二训练集并输入到二分类线性回归模型中进行训练,将训练后的所述二分类线性回归模型以及多个孤立树模型作为异常诊断模型。通过本文实施例,综合区块链的多个异常监测指标,结合孤立森林算法以及二分类线性回归模型,得到包括双层学习模型的异常诊断模型。
-
公开(公告)号:CN114943309A
公开(公告)日:2022-08-26
申请号:CN202210856488.2
申请日:2022-07-21
Applicant: 人民法院信息技术服务中心
Abstract: 本文涉及区块链技术领域,尤其涉及一种区块链的异常诊断模型的构建方法及异常诊断方法。包括,获取区块链的多项监测指标的数据;将每项监测指标的数据划分为多个按顺序排列的第一训练集;将每个第一训练集输入到对应的孤立树模型进行训练并得到多个第一诊断结果;对多个第一诊断结果进行投票得到每一项监测指标的第二诊断结果;将每一项监测指标的第二诊断结果作为第二训练集并输入到二分类线性回归模型中进行训练,将训练后的所述二分类线性回归模型以及多个孤立树模型作为异常诊断模型。通过本文实施例,综合区块链的多个异常监测指标,结合孤立森林算法以及二分类线性回归模型,得到包括双层学习模型的异常诊断模型。
-
公开(公告)号:CN115712623B
公开(公告)日:2023-07-18
申请号:CN202211468833.1
申请日:2022-11-22
Applicant: 中国司法大数据研究院有限公司
IPC: G06F16/22 , G06F16/2458 , G06F16/28
Abstract: 本发明公开了一种基于捕获元数据变更的批量数据容错采集方法,其步骤包括:1)定时任务获取数据源的元数据最新版本信息,当发生变化时将该数据源的元数据信息推送给消息中间件;2)消息中间件根据该数据源的元数据最新版本信息与上一版本信息,依次进行元数据识别、元数据纠错、元数据匹配、元数据对比,如果对比结果是字段数量发生变更则进行容错处理并暂停当前任务;如果对比结果是字段类型发生变更,则判断变更后的字段类型是否和hive类型对应,如果对应,则继续当前的批量采集任务;如果变更后的字段类型与hive类型不对应则进行容错处理并暂停当前任务;3)根据执行完容错处理所生成的批量采集任务,对数据源进行数据采集。
-
公开(公告)号:CN116304019A
公开(公告)日:2023-06-23
申请号:CN202310028014.3
申请日:2023-01-09
Applicant: 中国司法大数据研究院有限公司
IPC: G06F16/35 , G06F40/211 , G06F40/289 , G06Q50/18
Abstract: 本发明公开了一种争议焦点体系构建与识别方法。本方法步骤包括:1)对裁判文书集中的每一裁判文书进行分段处理,得到裁判文书的事实认定段和裁判说理段集合D;2)从集合D中筛选出蕴含争议焦点的事实认定段和裁判说理段,得到蕴含争议焦点的数据集D1;从数据集D1中提取争议焦点语句,得到争议焦点数据集D2;3)对数据集D2进行聚类,形成争议焦点语句聚类簇;4)结合相关法律知识对聚类结果进行归纳总结,形成多层级争议焦点知识体系;5)结合知识体系对裁判文书集中的裁判文书进行标注,得到争议焦点知识体系识别模型;6)当给定一篇裁判文书A,提取裁判文书A中的争议焦点语句并将其输入该模型,识别出裁判文书A的争议焦点。
-
公开(公告)号:CN116304019B
公开(公告)日:2023-09-12
申请号:CN202310028014.3
申请日:2023-01-09
Applicant: 中国司法大数据研究院有限公司
IPC: G06F16/35 , G06F40/211 , G06F40/289 , G06Q50/18
Abstract: 本发明公开了一种争议焦点体系构建与识别方法。本方法步骤包括:1)对裁判文书集中的每一裁判文书进行分段处理,得到裁判文书的事实认定段和裁判说理段集合D;2)从集合D中筛选出蕴含争议焦点的事实认定段和裁判说理段,得到蕴含争议焦点的数据集D1;从数据集D1中提取争议焦点语句,得到争议焦点数据集D2;3)对数据集D2进行聚类,形成争议焦点语句聚类簇;4)结合相关法律知识对聚类结果进行归纳总结,形成多层级争议焦点知识体系;5)结合知识体系对裁判文书集中的裁判文书进行标注,得到争议焦点知识体系识别模型;6)当给定一篇裁判文书A,提取裁判文书A中的争议焦点语句并将其输入该模型,识别出裁判文书A的争议焦点。
-
公开(公告)号:CN116304033A
公开(公告)日:2023-06-23
申请号:CN202310171687.4
申请日:2023-02-27
Applicant: 中国司法大数据研究院有限公司
IPC: G06F16/35 , G06F18/24 , G06F18/214 , G06F18/21
Abstract: 本发明公开了一种基于半监督、双层多分类的诉请识别方法,其步骤包括:1)获取训练文本集,包括标注数据集和未标注数据集;2)利用标注数据集对教师模型进行训练并得到各标注类别的自适应阈值;利用训练后的教师模型对未标注数据集中的每一未标注诉讼请求数据进行分类和标注,得到伪标签标注数据;3)利用伪标签标注数据和有标注诉讼请求数据训练学生模型,得到学生模型;4)利用学生模型对测试集中的数据进行分类预测,根据分类预测结果计算每一类别的F1分数;如果低于设定阈值,则将该类别下样本训练得到多任务模型;5)将学生模型和多任务模型串联组成双层模型;6)将待分类的民事诉请文本输入双层模型中,得到诉讼请求类别。
-
公开(公告)号:CN118839692B
公开(公告)日:2025-03-14
申请号:CN202411077675.6
申请日:2024-08-07
Applicant: 中国司法大数据研究院有限公司
IPC: G06F40/279 , G06F18/213 , G06F18/2431
Abstract: 本发明公开一种基于BERT‑S6模型的法律核心要素识别方法及系统,属于文字分类技术领域。所述方法包括:对待检测文本进行分词;将分词结果输入BERT‑S6堆叠块,得到该待检测文本的法律核心要素识别结果;其中,所述BERT‑S6堆叠块由多个BERT‑S6块堆叠组成,每一BERT‑S6块的处理过程包括:基于S6模型获取输入信息的第一内容表示,所述输入信息为上一个BERT‑S6块的输出信息,且第一个BERT‑S6块的输入信息为所述分词结果;基于BERT模型获取输入信息的第二内容表示;依据所述第一内容表示和所述第二内容表示,得到该BERT‑S6块的输出信息。本发明可以在法律要素识别的多标签分类任务中有效的提取并识别长序列文本的上下文逻辑关系。
-
公开(公告)号:CN118839692A
公开(公告)日:2024-10-25
申请号:CN202411077675.6
申请日:2024-08-07
Applicant: 中国司法大数据研究院有限公司
IPC: G06F40/279 , G06F18/213 , G06F18/2431
Abstract: 本发明公开一种基于BERT‑S6模型的法律核心要素识别方法及系统,属于文字分类技术领域。所述方法包括:对待检测文本进行分词;将分词结果输入BERT‑S6堆叠块,得到该待检测文本的法律核心要素识别结果;其中,所述BERT‑S6堆叠块由多个BERT‑S6块堆叠组成,每一BERT‑S6块的处理过程包括:基于S6模型获取输入信息的第一内容表示,所述输入信息为上一个BERT‑S6块的输出信息,且第一个BERT‑S6块的输入信息为所述分词结果;基于BERT模型获取输入信息的第二内容表示;依据所述第一内容表示和所述第二内容表示,得到该BERT‑S6块的输出信息。本发明可以在法律要素识别的多标签分类任务中有效的提取并识别长序列文本的上下文逻辑关系。
-
-
-
-
-
-
-
-
-