-
公开(公告)号:CN110750635B
公开(公告)日:2023-12-15
申请号:CN201911009433.2
申请日:2019-10-21
Applicant: 南京大学
IPC: G06F16/335 , G06F16/33 , G06F40/289 , G06F40/30 , G06N3/08 , G06Q50/18 , G06N3/045 , G06N3/0442
Abstract: 本发明公开了一种基于法条关系的法条推荐方法,包括以下步骤:从中国裁判文书网收集裁判文书,构成训练语料;对训练语料进行预处理,包括对案件事实、指控罪名、引用法条三者的不同处理;对用户输入进行预处理;划分数据集,训练本发明设计的一个基于法条关系的联合生成模型,该模型基于罪名预测任务辅助法条推荐任务进行学习;根据训练好的联合生成模型提取推荐法条集;输出推荐法条集。本发明利用编码器‑解码器框架,基于法条关系,结合案件事实、控告罪名、引用法条三者之间的深度关联,设计了一种全新的联合生成模型。实现表明,该模型改善了法条推荐任务的预测效果,适用于真实场景下的法条推荐任务。
-
公开(公告)号:CN112148868A
公开(公告)日:2020-12-29
申请号:CN202011036948.4
申请日:2020-09-27
Applicant: 南京大学
IPC: G06F16/335 , G06F16/35 , G06F40/216 , G06F40/289 , G06K9/62 , G06N3/08 , G06Q50/18
Abstract: 本发明公开了一种基于法条共现的法条推荐方法,包括以下步骤:从中国裁判文书网上下载裁判文书,构建训练语料;将裁判文书进行预处理,包括中文分词、去停止词、文本特征化及数据降维;对用户输入的案件情况进行预处理;训练基于人工神经网络的案由分类模型,根据案件基本情况预测案由;针对不同的案由分别训练一个基于人工神经网络的法条分类模型,根据案由缩小适合被推荐的法条的范围;对候选推荐法条集进行共现分析,输出推荐法条列表。本发明模拟法官在实际审判过程中,通过判断案由缩小法条引用的范围继而寻找合适法条的真实场景,依靠法条间的共现分析对候选推荐法条集重新排序,从而改善法条推荐的效果,提高了法条推荐的准确性。
-
公开(公告)号:CN112148867A
公开(公告)日:2020-12-29
申请号:CN202011036946.5
申请日:2020-09-27
Applicant: 南京大学
IPC: G06F16/335 , G06K9/62 , G06N3/04 , G06N3/08 , G06Q10/04
Abstract: 本发明公开了一种基于法条关系的法条推荐方法,包括以下步骤:从中国裁判文书网收集裁判文书,构成训练语料;对训练语料进行预处理,包括对案件事实、指控罪名、引用法条三者的不同处理;对用户输入进行预处理;划分数据集,训练本发明设计的一个基于法条关系的联合生成模型,该模型基于罪名预测任务辅助法条推荐任务进行学习;根据训练好的联合生成模型提取推荐法条集;输出推荐法条集。本发明利用编码器‑解码器框架,基于法条关系,结合案件事实、控告罪名、引用法条三者之间的深度关联,设计了一种全新的联合生成模型。实现表明,该模型改善了法条推荐任务的预测效果,适用于真实场景下的法条推荐任务。
-
公开(公告)号:CN110991694A
公开(公告)日:2020-04-10
申请号:CN201911049086.6
申请日:2019-10-30
Applicant: 南京大学
IPC: G06Q10/04 , G06Q50/18 , G06F40/211 , G06F40/289
Abstract: 本发明公开了一种基于深度学习的量刑预测方法,包括以下步骤:步骤(1)根据案由从裁判文书数据库中提取裁判文书集,构建训练语料,裁判文书预处理,进行分词分句,转化为词向量;相关法条预处理,将法条转化为词向量;提取文书特征信息,使用深度学习和正则表达式结合的方式获取文本特征;进行量刑预测;输出量刑结果和罚金。本发明模拟法官在实际审判过程中,提取文书特征并作证发条以得出量刑预测的真实场景,从文书特征提取入手,说明了一种量刑预测方法。
-
公开(公告)号:CN110737781A
公开(公告)日:2020-01-31
申请号:CN201911003330.5
申请日:2019-10-21
Applicant: 南京大学
Abstract: 本发明公开了一种基于多层知识门的法条与事实关系计算方法,包括以下步骤:提取裁判文书集并预处理文书;构建法律专用停用词典;训练词向量模型;对用户输入进行预处理;输出事实与法条关系的预测结果。本发明用于法官在实际审判过程中或审判结束后对案件进行梳理或检查的真实场景,基于输入文本的先验知识,采用多层知识门机制的方法过滤事实和法条正文中的噪声,得到的事实法条的新向量表达,能够有效提升模型预测的准确度。同时,利用法条上级目录之间的层级关系大大提高了门机制的过滤效果。
-
公开(公告)号:CN110717843A
公开(公告)日:2020-01-21
申请号:CN201911009434.7
申请日:2019-10-21
Applicant: 南京大学
IPC: G06Q50/18 , G06F16/9535 , G06N3/04 , G06N3/08 , G06F40/289 , G06K9/62
Abstract: 本发明公开了一种可复用的法条推荐框架,包括以下步骤:提取裁判文书集构建训练语料;对裁判文书进行预处理,包括抽取出案件基本情况段落和引用法条列表,对案件基本情况进行中文分词,学习案件基本情况的向量表示模型,构建法条推荐任务的输出空间以及学习法条的语义向量模型;对用户输入的案件情况进行预处理;设计多标签分类模型对法条集进行预排序获得候选推荐法条集;对候选推荐法条集进行二次排序,获得最终推荐结果;输出推荐法条列表。本发明模拟给定案件基本情况筛选相关法条进行引用的真实场景,额外考虑法条自身的语义信息、法条与法条之间的关联进行法条推荐,通过再排序策略优化推荐结果,提高了法条推荐的准确性。
-
公开(公告)号:CN109376251A
公开(公告)日:2019-02-22
申请号:CN201811143903.X
申请日:2018-09-25
Applicant: 南京大学
Abstract: 本发明公开了一种基于词向量学习模型的微博中文情感词典构建方法,包括:(1)针对当前微博数据的特征来获取相应的训练语料;(2)对训练语料进行数据预处理工作;(3)构造候选词典;(4)构造种子情感词典;(5)训练参数与配置的选取和定义;(6)训练词向量学习模型;(7)评估词向量学习模型训练结果;(8)迭代执行步骤(6),直到所有参数遍历训练完毕;(9)选择最优评估结果的词向量;(10)训练词语级情感极性分类器;(11)应用词语级情感极性分类器并获取最终的目标情感词典。本发明设计了一个结合语义和情感信息的词向量学习模型,由此设计了面向微博的中文情感词典构建方法,可以提升获取中文情感词典的效率与质量。
-
公开(公告)号:CN108776653A
公开(公告)日:2018-11-09
申请号:CN201810534689.4
申请日:2018-05-25
Applicant: 南京大学
IPC: G06F17/27
Abstract: 本发明公开了一种基于PageRank和信息熵的裁判文书的文本分词方法,该发明属于自然语言处理领域中的中文分词技术,主要采用了改进的PageRank算法、信息熵、互信息以及关键词词典对中文文本进行分词。本发明针对法律领域的裁判文书,在PageRank算法基础上建立了分词方法,根据Rank向量切分候选词,并利用信息熵对候选词进行修正,再依据裁判文书的关键词词典做术语合并,最终输出分词结果,该方法能够较为准确地对裁判文书进行分词。本发明与现有方法相比,其显著优点是:不需要通过大量文本语料库进行统计或训练以建立大规模的词典,仅对输入文本进行统计,将输入文本作为现有语料库进行统计挖掘,最终结合裁判文书的关键词术语词典即可完成分词。
-
公开(公告)号:CN108763485A
公开(公告)日:2018-11-06
申请号:CN201810534766.6
申请日:2018-05-25
Applicant: 南京大学
CPC classification number: G06F17/271 , G06F17/2775 , G06F17/2785
Abstract: 本发明是一种基于文本相似度的裁判文书证据链关系模型构建方法,该构建方法的主要步骤包括:(1)针对中文裁判文书进行文本预处理;(2)读取预处理后裁判文书中的证据段与事实段;(3)抽取证据链体及事实的What、Where、Who、When和How Much这五类关键要素;(4)通过计算关键要素联结计算构造证据链关系模型中的证据与证据的关联以及证据与事实的关联完成模型构建;(5)并计算建模后的证据链关系模型中每条证据链的权重;(6)将构建出的模型以Excel表格格式输出;(7)使用证据链建模工具展示生成的证据链关系模型的结构。本发明主要针对中国法律裁判文书说理评估中的证据链关系模型构建任务,根据裁判文书说理的特征和法院文书的结构特点,改善裁判文书预处理方法,优化关键要素提取技术,能够有效运用于评估裁判文书的事实说理水平。
-
公开(公告)号:CN107291688A
公开(公告)日:2017-10-24
申请号:CN201710376341.2
申请日:2017-05-22
Applicant: 南京大学
Abstract: 本发明公开了一种基于主题模型的裁判文书相似度分析方法。该方法采用机器学习中的LDA(Latent Dirichlet Allocation)主题模型,针对裁判文书,提出一种基于语义的、半自动化的、通用的相似度分析方法。本方法主要包括选取语料、建立相似度标注、文本预处理、输入选取、参数设置、迭代训练、生成模型和应用模型等步骤。该方法在一般相似度分析方法的基础上,充分考虑裁判文书内容上专业词汇丰富、语义复杂的特点,利用裁判文书半结构化的特性,从而提升了裁判文书相似度分析的准确性和适用性。
-
-
-
-
-
-
-
-
-