一种基于Transformer的多标签罪名预测方法

    公开(公告)号:CN117009514A

    公开(公告)日:2023-11-07

    申请号:CN202310575350.X

    申请日:2023-05-19

    Applicant: 南京大学

    Abstract: 本发明公开了一种基于Transformer的多标签罪名预测方法,包括以下步骤:爬取裁判文书并融合CAIL数据构造数据集;数据预处理,包括从裁判文书中抽取出案件基本情况段落、引用法条列表、罪名等信息,平衡单标签多标签数据,构造词表,去停用词,法条名称标准化;预训练词嵌入层;训练相关法条预测神经网络以获取与案情相关的法条;训练罪名预测神经网络;输出预测的罪名列表。本发明针对罪名预测中一个被告对应多个罪名的预测问题,提出了一种面向数罪并罚的罪名预测方法。另外,针对其他传统罪名预测方法中外部知识不足的问题,提出了一种融合案件基本情况和相关法条的方法,显著提升了模型的性能与可解释性。

Patent Agency Ranking