一种基于改进卷积神经网络的裁判文书行业分类方法

    公开(公告)号:CN110751216A

    公开(公告)日:2020-02-04

    申请号:CN201911003568.8

    申请日:2019-10-21

    Applicant: 南京大学

    Abstract: 本发明公开了一种基于改进卷积神经网络的裁判文书行业分类方法,包括以下步骤:获取产品质量公开民事文书数据;定义文书涉及行业;人工标注文书涉及行业并筛除无效数据;文书数据预处理,包括结构化文书,提取原告诉称段,数据清洗,计算数据长度分布并统一限制序列最大长度;分层抽样划分训练集、验证集与测试集;创建字符与词语字典;构建与训练改进卷积神经网络分类器,包括基于字符和词语思想表示文书文本,构建基于字符与词语的双通道组合卷积,采取多种类型卷积核,采用k-max-mean池化;输入相关裁判文书,预测文书涉及行业。本发明不需要做任何特征工程相关工作;所提出的改进卷积神经网络模型架构用于裁判文书分类,能够达到更好的效果。

    一种基于深度学习和特征融合的文本情感分类方法

    公开(公告)号:CN110750648A

    公开(公告)日:2020-02-04

    申请号:CN201911003328.8

    申请日:2019-10-21

    Applicant: 南京大学

    Abstract: 本发明提出一种基于深度学习和特征融合的文本情感分类方法,该方法通过整合层次特征学习文本表示,包括:根据文本极性及否定词,为情感词设计不同环境的向量表示;为词性采样得到向量区分同形词;结合表情符优化词向量,使用神经网络模型学习基于词向量的单句特征;通过字序列学习基于字向量的单句特征;两部分拼接得到句子级特征;对于至少包含两个单句的文档,句向量序列输入到上层神经网络学习基于神经网的文档特征,并对段首、段尾和包含总结词的句子取平均获得基于规则的文档特征,两部分拼接获得文档级特征。针对具体任务,将单句或文档特征输入随机森林分类器即可预测情感类别。与基础模型相比,本发明能够有效提高文本情感分类的准确性。

    一种基于联合深度学习模型的法条推荐方法

    公开(公告)号:CN110750635A

    公开(公告)日:2020-02-04

    申请号:CN201911009433.2

    申请日:2019-10-21

    Applicant: 南京大学

    Abstract: 本发明公开了一种基于法条关系的法条推荐方法,包括以下步骤:从中国裁判文书网收集裁判文书,构成训练语料;对训练语料进行预处理,包括对案件事实、指控罪名、引用法条三者的不同处理;对用户输入进行预处理;划分数据集,训练本发明设计的一个基于法条关系的联合生成模型,该模型基于罪名预测任务辅助法条推荐任务进行学习;根据训练好的联合生成模型提取推荐法条集;输出推荐法条集。本发明利用编码器-解码器框架,基于法条关系,结合案件事实、控告罪名、引用法条三者之间的深度关联,设计了一种全新的联合生成模型。实现表明,该模型改善了法条推荐任务的预测效果,适用于真实场景下的法条推荐任务。

    一种裁判文书说理评估方法

    公开(公告)号:CN109582950A

    公开(公告)日:2019-04-05

    申请号:CN201811143966.5

    申请日:2018-09-25

    Applicant: 南京大学

    Abstract: 本发明公开了一种基于计算相似度的裁判文书说理评估方法,主要步骤包括:切分法条前后件;使用XML解析技术提取出文书中的关键信息;构建法律专有停用词库,输入文本预处理等;将输入文本输入进模型中得到文本匹配结果;若是“法条与结论”的评估,使用“匹配关键字,比较量刑程度”的思路来判断逻辑是否一致;综合每一项评估主体的计算结果,将清晰简明的评估结果反馈给系统用户。本发明模拟法官检验裁判文书是否存在说理缺少关键环节、说理不充分、判决结果不合理的真实应用场景,每篇文书的评估速度约为8~10秒,速度较快,对于常见的9种刑事案件的评估准确率较高,能够满足真实应用场景下的使用要求。

    一种面向裁判文书的法条名称规范化及案由与法条的关联统计方法

    公开(公告)号:CN108897770A

    公开(公告)日:2018-11-27

    申请号:CN201810534856.5

    申请日:2018-05-25

    Applicant: 南京大学

    Abstract: 本发明公开了一种面向裁判文书的法条名称规范化及案由与法条的关联统计方法。本方法面对法院的裁判文书,采用了编辑距离算法,对法条法规进行规范化处理,针对裁判文书中案由和法条之间的密切关系,提出了案由法条关联统计分析方法。本方法主要包括裁判文书的半结构化预处理,读取结构化文书中案由和法条信息,法律法条的规范化处理,法律法条按实体法真实情况进行筛选并建立数据库,生成EXCEL表单形式的案由法条关联统计信息,生成TXT形式的法条案由关联统计信息。本方法充分考虑裁判文书人为书写错误,规范化法条名称,统计出各案由的常引法条的规律。

    基于词向量模型的法条推荐方法

    公开(公告)号:CN109446416B

    公开(公告)日:2021-09-28

    申请号:CN201811170180.2

    申请日:2018-09-26

    Applicant: 南京大学

    Abstract: 本发明公开了一种基于词向量模型的法条推荐方法,该发明属于推荐系统技术领域中的协同过滤推荐技术,协同过滤是通过借助相似的事物来为事物推荐或者筛选信息的技术,推荐法条需要借助裁判文书中的基本案件情况获取其他案情相近的文书,然后根据多个前例推荐法条。本发明与现有方法相比,其显著优点是:引入词向量模型后,通过词向量的计算能够更准确地表达两段案件基本情况的相似程度,从而为裁判文书找到案情更相似的文书。并且根据多个相似案情的文书可以采取多种协同过滤推荐策略,获得更准确的推荐结果。

    基于词向量模型的法条推荐方法

    公开(公告)号:CN109446416A

    公开(公告)日:2019-03-08

    申请号:CN201811170180.2

    申请日:2018-09-26

    Applicant: 南京大学

    Abstract: 本发明公开了一种基于词向量模型的法条推荐方法,该发明属于推荐系统技术领域中的协同过滤推荐技术,协同过滤是通过借助相似的事物来为事物推荐或者筛选信息的技术,推荐法条需要借助裁判文书中的基本案件情况获取其他案情相近的文书,然后根据多个前例推荐法条。本发明与现有方法相比,其显著优点是:引入词向量模型后,通过词向量的计算能够更准确地表达两段案件基本情况的相似程度,从而为裁判文书找到案情更相似的文书。并且根据多个相似案情的文书可以采取多种协同过滤推荐策略,获得更准确的推荐结果。

    一种基于LDA主题模型的法条推荐方法

    公开(公告)号:CN108763484A

    公开(公告)日:2018-11-06

    申请号:CN201810534723.8

    申请日:2018-05-25

    Applicant: 南京大学

    CPC classification number: G06Q50/18

    Abstract: 本发明是一种基于LDA主题模型的法条推荐方法,包括以下步骤:提取裁判文书集构建训练语料;将裁判文书进行预处理,包括抽取出案件基本情况段落和引用法条列表,将案件基本情况进行中文分词,去除法律专有停用词以及法条名称标准化;对案件情况进行预处理;训练LDA主题模型提取与案件情况相似的裁判文书集;提取推荐法条集,设计法条关联度打分机制计算法条与案件的关联度,并结合频繁项集挖掘关联法条;输出推荐法条列表。本发明模拟法官在实际审判过程中,经常查阅相似裁判文书来决定法条引用的真实场景,从语义层面度量了裁判文书的相似度,能准确获得相似的裁判文书并进行关联法条推荐,提高了法条推荐的准确性。

    一种基于联合深度学习模型的法条推荐方法

    公开(公告)号:CN110750635B

    公开(公告)日:2023-12-15

    申请号:CN201911009433.2

    申请日:2019-10-21

    Applicant: 南京大学

    Abstract: 本发明公开了一种基于法条关系的法条推荐方法,包括以下步骤:从中国裁判文书网收集裁判文书,构成训练语料;对训练语料进行预处理,包括对案件事实、指控罪名、引用法条三者的不同处理;对用户输入进行预处理;划分数据集,训练本发明设计的一个基于法条关系的联合生成模型,该模型基于罪名预测任务辅助法条推荐任务进行学习;根据训练好的联合生成模型提取推荐法条集;输出推荐法条集。本发明利用编码器‑解码器框架,基于法条关系,结合案件事实、控告罪名、引用法条三者之间的深度关联,设计了一种全新的联合生成模型。实现表明,该模型改善了法条推荐任务的预测效果,适用于真实场景下的法条推荐任务。

    一种基于法条共现的法条推荐方法

    公开(公告)号:CN112148868A

    公开(公告)日:2020-12-29

    申请号:CN202011036948.4

    申请日:2020-09-27

    Applicant: 南京大学

    Abstract: 本发明公开了一种基于法条共现的法条推荐方法,包括以下步骤:从中国裁判文书网上下载裁判文书,构建训练语料;将裁判文书进行预处理,包括中文分词、去停止词、文本特征化及数据降维;对用户输入的案件情况进行预处理;训练基于人工神经网络的案由分类模型,根据案件基本情况预测案由;针对不同的案由分别训练一个基于人工神经网络的法条分类模型,根据案由缩小适合被推荐的法条的范围;对候选推荐法条集进行共现分析,输出推荐法条列表。本发明模拟法官在实际审判过程中,通过判断案由缩小法条引用的范围继而寻找合适法条的真实场景,依靠法条间的共现分析对候选推荐法条集重新排序,从而改善法条推荐的效果,提高了法条推荐的准确性。

Patent Agency Ranking