一种基于半监督、双层多分类的诉请识别方法

    公开(公告)号:CN116304033A

    公开(公告)日:2023-06-23

    申请号:CN202310171687.4

    申请日:2023-02-27

    Abstract: 本发明公开了一种基于半监督、双层多分类的诉请识别方法,其步骤包括:1)获取训练文本集,包括标注数据集和未标注数据集;2)利用标注数据集对教师模型进行训练并得到各标注类别的自适应阈值;利用训练后的教师模型对未标注数据集中的每一未标注诉讼请求数据进行分类和标注,得到伪标签标注数据;3)利用伪标签标注数据和有标注诉讼请求数据训练学生模型,得到学生模型;4)利用学生模型对测试集中的数据进行分类预测,根据分类预测结果计算每一类别的F1分数;如果低于设定阈值,则将该类别下样本训练得到多任务模型;5)将学生模型和多任务模型串联组成双层模型;6)将待分类的民事诉请文本输入双层模型中,得到诉讼请求类别。

    一种基于法律文书结构特点的案由识别方法及装置

    公开(公告)号:CN117350294A

    公开(公告)日:2024-01-05

    申请号:CN202311418562.3

    申请日:2023-10-30

    Abstract: 本发明公开了一种基于法律文书结构特点的案由识别方法及装置。本方法包括:1)根据确定支持的案件类型和文书类型,获取每一案件类型的多个案件;2)针对每一案件类型,构建该案件类型的标准案由库;3)根据每一案件类型的标准案由库,结合该案件类型的案件文书数据的段落特点相互校验的方式构建训练样本集;4)计算每一样本的案由名称在案由提取段中的位置,得到符合UIE模型的训练集格式的训练样本集合U;5)利用训练样本集合U训练所述UIE模型,得到命名体识别模型;6)将待处理文书数据集中一案件A的文书数据输入命名体识别模型,得到该案件A的备选案由集;将该备选案由集与对应的标准案由库进行匹配,得到案件A的案由名称。

    一种基于半监督、双层多分类的诉请识别方法

    公开(公告)号:CN116304033B

    公开(公告)日:2023-11-03

    申请号:CN202310171687.4

    申请日:2023-02-27

    Abstract: 本发明公开了一种基于半监督、双层多分类的诉请识别方法,其步骤包括:1)获取训练文本集,包括标注数据集和未标注数据集;2)利用标注数据集对教师模型进行训练并得到各标注类别的自适应阈值;利用训练后的教师模型对未标注数据集中的每一未标注诉讼请求数据进行分类和标注,得到伪标签标注数据;3)利用伪标签标注数据和有标注诉讼请求数据训练学生模型,得到学生模型;4)利用学生模型对测试集中的数据进行分类预测,根据分类预测结果计算每一类别的F1分数;如果低于设定阈值,则将该类别下样本训练得到多任务模型;5)将学生模型和多任务模型串联组成双层模型;6)将待分类的民事诉请文本输入双层模型中,得到诉讼请求类别。

    一种基于法律文书结构特点的案由识别方法及装置

    公开(公告)号:CN117350294B

    公开(公告)日:2024-10-11

    申请号:CN202311418562.3

    申请日:2023-10-30

    Abstract: 本发明公开了一种基于法律文书结构特点的案由识别方法及装置。本方法包括:1)根据确定支持的案件类型和文书类型,获取每一案件类型的多个案件;2)针对每一案件类型,构建该案件类型的标准案由库;3)根据每一案件类型的标准案由库,结合该案件类型的案件文书数据的段落特点相互校验的方式构建训练样本集;4)计算每一样本的案由名称在案由提取段中的位置,得到符合UIE模型的训练集格式的训练样本集合U;5)利用训练样本集合U训练所述UIE模型,得到命名体识别模型;6)将待处理文书数据集中一案件A的文书数据输入命名体识别模型,得到该案件A的备选案由集;将该备选案由集与对应的标准案由库进行匹配,得到案件A的案由名称。

    一种基于一致性思维链推理的多任务案件特征提取方法

    公开(公告)号:CN117609758A

    公开(公告)日:2024-02-27

    申请号:CN202311464958.1

    申请日:2023-11-06

    Abstract: 本发明公开了一种基于一致性思维链推理的多任务案件特征提取方法,其步骤包括:S1:对所选公开裁判文书集中的每一裁判文书进行分段处理,得到事实认定段集合A1;S2:构建案件特征解释集合E1,利用大语言模型构建思维链集合E2;S3:利用思维链集合E2构建含思维链的提示指令,调用大语言模型,构建案件特征提取模型M1;S4:基于投票的自适应方法,利用模型M1对集合A1进行案件特征提取,得到事实认定段的案件特征预测标签集B及对应的推理过程R;S5:基于标签集B及推理过程R构建训练集训练生成式模型,得到案件特征多任务提取模型;S6:将待处理裁判文书的事实认定段输入到案件特征多任务提取模型,得到案件特征。

    一种基于大模型辅助的案件特征识别方法

    公开(公告)号:CN117633493A

    公开(公告)日:2024-03-01

    申请号:CN202311479686.2

    申请日:2023-11-08

    Abstract: 本发明公开了一种基于大模型辅助的案件特征识别方法。本方法为:1)获取多个案件并进行标注,得到一训练案件特征训练文本集;2)获取用于辅助选择最优特征提示模板的伪标注数据,作为辅助测试集;3)利用所选大模型为设定案由下的每个案件特征生成P个特征提示模板,利用多个其他大模型对每个案件特征的特征提示模板打分,选出排名前p个模板;将所选模板组合成q组实验数据,并划分为训练集和测试集;采用每组实验数据的训练集训练同一目标模型,得到q个训练后的模型;4)利用训练数据集训练q个模型得到最终的模型;5)将一目标文书中用于识别案件特征的数据输入模型中,得到该目标文书的案件特征。本发明提高了特征识别准确性和可靠性。

Patent Agency Ranking