-
公开(公告)号:CN118839692B
公开(公告)日:2025-03-14
申请号:CN202411077675.6
申请日:2024-08-07
Applicant: 中国司法大数据研究院有限公司
IPC: G06F40/279 , G06F18/213 , G06F18/2431
Abstract: 本发明公开一种基于BERT‑S6模型的法律核心要素识别方法及系统,属于文字分类技术领域。所述方法包括:对待检测文本进行分词;将分词结果输入BERT‑S6堆叠块,得到该待检测文本的法律核心要素识别结果;其中,所述BERT‑S6堆叠块由多个BERT‑S6块堆叠组成,每一BERT‑S6块的处理过程包括:基于S6模型获取输入信息的第一内容表示,所述输入信息为上一个BERT‑S6块的输出信息,且第一个BERT‑S6块的输入信息为所述分词结果;基于BERT模型获取输入信息的第二内容表示;依据所述第一内容表示和所述第二内容表示,得到该BERT‑S6块的输出信息。本发明可以在法律要素识别的多标签分类任务中有效的提取并识别长序列文本的上下文逻辑关系。
-
公开(公告)号:CN118839692A
公开(公告)日:2024-10-25
申请号:CN202411077675.6
申请日:2024-08-07
Applicant: 中国司法大数据研究院有限公司
IPC: G06F40/279 , G06F18/213 , G06F18/2431
Abstract: 本发明公开一种基于BERT‑S6模型的法律核心要素识别方法及系统,属于文字分类技术领域。所述方法包括:对待检测文本进行分词;将分词结果输入BERT‑S6堆叠块,得到该待检测文本的法律核心要素识别结果;其中,所述BERT‑S6堆叠块由多个BERT‑S6块堆叠组成,每一BERT‑S6块的处理过程包括:基于S6模型获取输入信息的第一内容表示,所述输入信息为上一个BERT‑S6块的输出信息,且第一个BERT‑S6块的输入信息为所述分词结果;基于BERT模型获取输入信息的第二内容表示;依据所述第一内容表示和所述第二内容表示,得到该BERT‑S6块的输出信息。本发明可以在法律要素识别的多标签分类任务中有效的提取并识别长序列文本的上下文逻辑关系。
-